了解太阳能软件的准确性

机器翻译，未经校对人员审核，可能存在错误。

在本文件中

你将了解为何准确的太阳模拟软件和高质量输入数据对于优化能源预测和系统设计至关重要。了解关键指标和相关术语有助于理解计算出的PV输出中预期的偏差范围。

概述

太阳能项目中的每一个决策都依赖于准确的数据。在光伏软件的背景下，准确性确保电厂计算值的可靠性。可靠的数据支持实现目标，如实现最优设计、为未来项目争取资金，以及作为现有电厂性能评估的基准。

评估太阳辐射模型性能的最有效方法是将其输出与参考值进行比较——这一过程称为模型验证。这种比较产生了验证统计数据，这对于评估模型的性能和可靠性至关重要。理解术语对于有效解读这些统计数据并得出可靠结论至关重要。

验证太阳能仿真软件（如Solargis）预期光伏功率输出的准确性并不容易。首先，它涉及验证用于模拟的太阳辐照度、气象和环境数据输入，始终确保作为参考的测量数据符合要求。其次，它涉及对PV计算链中涉及的模型和算法（光线追踪、单二极管等）进行验证。所有这些主题都在知识库的准确性部分得到涵盖。

除了天气数据输入和模型验证外，光伏模块和逆变器的技术规格错误还可能导致软件运行时的不准确性。评估软件输出的可靠性需要通过自动化和专家检查验证这些组件的置信等级——这一过程称为组件验证，详见知识库的光伏组件目录部分。

最后，分析验证统计数据揭示了模型的优缺点，从而开发用于估计产出不确定性的二级模型。

术语

一般来说，准确率的衡量标准是它与真实值的接近程度。实际上，这需要确定尽可能接近真实的参考值。我们不是直接与绝对真理比较——绝对真理往往无法获得——而是将未知准确的数据与已知且更准确的参考值进行比较。

在评估太阳能系统准确性时，理解关键术语对于正确解读数据和管理能源产额预测预期至关重要：

验证是将模型、软件或数据集与可靠的参考数据或标准进行评估，以确认其正确性和适合特定用途的过程。
验证是评估所提供的技术规范是否与实际参考规范一致的过程。这确保了能源仿真中使用的特性符合实际规范。
一致性 是指数据或预测在时间或不同场景中的可靠性。稳定的结果和最小的不稳定变异增强了对数据和模型的信任。
分辨率 是数据中可检测到的最小变化或增量（时间或空间）。对于太阳测量，这可能代表传感器能检测到的最小辐照度单位，以及典型的测量时间区间和空间（地理）表示，例如（对于网格数据）网格单元的大小。
不确定 性量化了真实值预期落在范围内的范围，通常以误差范围表示。它考虑了测量和模型的局限性，帮助用户理解潜在的偏差。
置信度表示某个数值位于特定区间内的确定程度。例如，95%置信区间表示真实值落在定义范围内的概率为95%。

验证统计

在比较模型输出与地面数据参考时，目标是评估两个数据集在给定地点和时间段下的相似性。为确保有意义的比较，应采用一套统计指标。这些指标有助于量化表现并识别潜在差异。

以下是模型与测量比较的关键统计指标描述：

偏差：量化模型输出与参考值之间的平均差异。理想情况下，偏置应接近零，表明模型中的系统误差最小。
平均绝对偏差（MAD）： 通过平均绝对误差值计算，确保所有偏差均被平等处理。这种方法防止正负误差在求和过程中相互抵消，从而更清晰地反映整体误差大小。
均方根偏差（RMSD）： 通过对平方偏差取平均确定，这使得更大的误差权重更大。这使得它在识别和强调重大差异的影响方面尤为有效。RMSD可以应用于不同聚合层级，如亚小时、小时或每日数值，从而在不同时间尺度上灵活评估模型表现。

为了使跨数据集或指标的比较具有意义，应用了归一化。归一化指标以相对于参考值的百分比表示，便于不同情景或数据集之间的交叉比较。

指示器		它代表什么	期望值
偏置	偏置或平均偏差偏差	描述给定地点的系统性模型偏差，即系统性高估或低估。	偏置越接近零，偏差越小。
疯狂	平均绝对偏差	显示了误差的扩散。它用于避免相反符号相互抵消的偏差。	MAD越接近零，误差越小
RMSD	均方根偏差	显示误差分布，赋予更大误差更高的权重。它应按不同细分计算（亚小时、小时、每日、每月）。	RMSD越低，误差分布越小

除了传统的误差指标外，单位不变指标还提供了宝贵的见解。这些包括：

相关系数（R）： 表示模型与参考数据线性关系的强度和方向。
决定系数（R²）： 反映了模型解释的参考数据中方差的比例。
科尔莫哥洛夫-斯米尔诺夫指数： 衡量模型与参考数据集累计分布的最大差异，突出分布差异。

指示器		它代表什么	期望值
R	相关系数	表示数据点与回归线的距离。	越接近1，测量与模型的相似度越高。
R²	决定系数	代表模型与数据的拟合程度。	越接近1，测量与模型的相似度越高。
KSI	柯尔莫哥洛夫-斯米尔诺夫指数	表示模型能够表示各种太阳辐照度条件，并表征数值分布的代表性。	KSI越低，数据集间分布的相似度越高。

一旦收集到足够多的验证点，计算汇总统计数据对于总结和分析整体模型表现变得至关重要。主要汇总指标包括：

参考样本数量： 验证研究中收集并使用的参考样本数量。例如，在验证辐照度模型的性能时，这指的是太阳能数据库在实际地面测量中经过测试和验证的地点数量。
所有偏差的平均值： 这代表所有验证点的平均偏差，提供了模型系统误差的整体衡量标准。平均偏倚接近零表明模型平均上不会持续高估或低估参考值。
偏差标准差： 这衡量了平均偏倚周围偏差的变异性或分布情况。较低的标准差表示模型的误差始终接近均值，而较高的数值则表示验证点间性能存在显著差异。
平均绝对偏置（MAB）： 偏差绝对值的平均值，能够在无抵消的情况下考虑正负误差，更清晰地表示误差的大小。

参考数据的要求

验证对于确保太阳能和气象数据库以及能源模拟和预报软件所提供结果的准确性和可靠性至关重要。为此，模型通常会与多个地点（即验证点）的地面测量数据进行比较。这一过程使研究人员能够评估模型的性能和准确性。

验证模型带来了更多挑战，因为测量条件从未完全完美。太阳能和气象数据验证需要具备专业知识，以理解仪器并在经过特定质量控制程序后分析测量值。

要使验证结果具有意义，必须考虑几个关键因素：参考数据的质量、验证样本数量，以及验证站点涵盖的多种情境（包括地理和技术层面）。

参考数据质量

验证数据的质量是参考数据中确保对比有效性最重要的方面之一。将高质量数据与低质量数据结合，可能导致偏差结果，无法准确反映模型性能。

对于太阳和气象数据，这意味着用于测试模型的地面测量必须准确、维护良好，并使用能够反映实际现场状况的顶级传感器捕捉。这还包括：

仪器经过正确校准。
一致的数据收集方案。
测量站的可靠维护。

验证样本数量

验证点的数量指的是模型被测试的参考点数量。仅凭单一参考点的验证统计无法代表模型性能。比较应使用足够数量的验证点进行。

模型间验证点数量的差异会影响比较结果。例如，一个用较少站点验证的太阳辐射模型可能无法完全反映其真实准确性。如果缺乏足够数量的验证点，尤其是在太阳能项目规划的关键地区，开发商可能面临更高的不确定性。

对于太阳能项目，准确率的每一个百分比都至关重要，因此利用尽可能多的站点数据来估算准确性至关重要。影响太阳辐射模型不确定性的因素复杂性要求尽可能多的验证点进行测试。

验证站点的地理分布

验证点的地理分布对于确定验证统计的代表性至关重要。由于纬度、海拔、气候和当地地理，太阳辐射模式在不同地区差异显著。

分布良好的验证点确保模型在不同地理条件下进行了测试。太阳辐照度受云量、湿度、气溶胶浓度和局部地理特征的影响。通过分析在不同条件下收集的长期地面传感器数据，研究人员可以确保太阳辐射模型在各种场景下都具有鲁棒性。

如果验证站点集中在特定区域，而其他地区代表性不足，统计数据可能无法完全反映模型在未测试区域的表现。例如，一个主要在欧洲验证的模型，如果热带或沙漠地区代表性不足，其表现可能不佳。

各种情况和测试技术

在测试仿真模型时，验证其在各种场景下的验证也非常重要。例如，在评估光学仿真模型时，应测试不同的光伏组件配置和电厂布局。同样，在评估光伏组件内部的能量转换时，应测试不同的光伏技术。

在不同条件下进行测试，使验证过程更加稳健，模型的准确性估计也更为准确。

从验证到不确定

分析验证统计数据为模型性能提供了宝贵的见解，帮助更深入地理解其优势与局限性。一旦获得足够的模型性能信息，这些信息就可以用于开发二级模型，以估计模型输出的不确定性。

对于特定模型，如基于卫星的太阳辐射数据，Solargis等机构积累的专业知识使得可靠的不确定性估计成为可能。本质上，这意味着利用多个站点的验证结果来预测特定站点的不确定性。通过这项努力，我们能够提供我们方法论中解释的年度卫星模拟GHI（全球水平辐射）和DNI（直接法向辐照度）值的预期偏差范围。

不确定性模型的复杂程度各异，从简单的近似到高级概率框架不等。尽管通过先进软件广泛可获得光伏能量产额模拟，但这些模拟中的不确定性仍未被充分探索。不确定性的关键来源包括输入参数、模型假设以及不同的操作条件。

Documentation Index