分析师预测误差

2024-05-19

分析师预测误差(精选八篇)

分析师预测误差 篇1

供水系统的作用应当是对各类用户尽可能经济地提供可靠而合乎水质要求的自来水, 以满足各类用户当前、未来的用水要求。城市供水系统用水量的变化, 以及用户的用水规律有其内在的规律, 主要体现在用水的周期性, 包括用水量变化的年趋势性、月周期性和时周期性。这种周期性是由于人类的生产、生活具有的规律性导致用水量变化的一种内在规律。

用水正是由于在不同时刻城市经济生产和居民生活情况的不断变动, 用水量会有一定的波动。在短期内, 城市用水量的变化具有周期性, 如月用水量的年周期性、时用水量的日周期性等;从较长时间来看, 它又具有年增长的趋势。这就使得城市用水量预测成为可能。

用水量预测就是根据历史用水量数据的变化规律, 并考虑社会、经济等主观因素和天气状况等客观因素的影响, 利用科学的、系统的或经验的数学方法, 在满足一定精度要求的意义下, 对城市未来某时间段内的用水量进行预测。

1 产生误差原因

产生城市用水量预测误差的原因很多, 主要有以下几个方面:

1.1

进行预测往往要用到数学模型, 而数学模型大多只包括所研究现象的某些主要因素, 很多次要的因素都被略去了。对于错综复杂的用水量变化来说, 这样的模型只是一种经过简单化了的用水量状况的反映, 与实际用水量之间存在差距, 用它来进行预测, 也就不可避免地会与实际用水量产生误差。

1.2

用水量所受影响是千变万化的, 进行预测的目的和要求又各种各样, 因而就有一个如何从许多预测方法中正确选用一个合适的预测方法的问题。如果选择不当的话, 也就随之而产生误差。

1.3

进行用水量预测要用到大量资料, 而各项资料并不能保证都是准确可靠, 这就必然会带来预测误差。

1.4 某种意外事件的发生或情况的突然变化, 也会造成预测误差。

以上各种不同原因引起的误差是混合在一起表现出来的, 因此, 当发现误差很大, 预测结果严重失动态, 必须针对以上各种原因逐一进行审查, 寻找根源, 加以改进。

2 预测误差分析

计算和分析城市用水量预测误差的方法和指标很多, 现主要介绍以下几种:

设{q0, qn, ..., qn}为实际用水量序列, {q0, q1, ..., qn}为预测用水量序列, 则有:

(1) 绝对误差 (Absolute Error) 与相对误差 (Relative Error)

这是一种直观的误差表示方法, 在城市用水量预测中作为一种考核指标经常使用。

(2) 平均绝对误差 (Mean Absolute Error)

(3) 均方误差 (Mean Square Error)

(4) 均方根误差 (Root Mean Square Error)

(5) 标准误差 (Standard Error)

式中:m为自由度, 也就是变量的个数, 即自变量和因变量的个数的综合。

(6) 平均绝对百分误差 (Mean Absolute Percentage Error)

(7) 后验差检验

后验差检验是根据模型预测值与实际值之间的统计情况, 进行检验的方法, 这是从概率预测方法中移植过来的。其内容是:以残差 (绝对误差) 为基础, 根据各期残差绝对值的大小, 考虑残差较小的点出现的概念, 以及与预测误差方差有关指标的大小。具体步骤如下:

设历史用水量序列为:

设预测值序列为:

k时刻残差:

实际值Q (k) 的平均值q:

残差e (k) 的平均值e軃:

历史数据方差为S:

残差方差为S:

则可得后验差检验的两个重要数据, 即:后验差比值C:

小误差概率P:

3 预测精度评价分析

选择用水量预测模型时, 要考虑许多因素, 包括数据模式、预测目的、预测精度等。其中最主要的控制因素是模型的预测精度。

预测精度, 是指模型预测结果与实际情况的符合程度。通常, 预测精度是以模型预测数据与实际数据之间的误差为标准来衡量。影响预测精度的不仅是预测模型本身, 还有其他的因素, 诸如缺乏足够的、有效的数据, 预测技术不当, 不能拟合原有的数据模式等等。因此, 需要考虑:

在确定的环境下, 用某种典型的预测模型所能达到的精度, 应比用简单又直观的方法进行预测, 精度相差多少, 比用复杂的方法进行预测其预测精度相差多少?

在确定的环境下, 采用什么方法能够提高预测精度, 提高多少?若存在几种提高预测精度的方法, 如何选择更适当的预测方法?

目前, 在城市用水量预测中主要用到下面几种精度评价方法。

(1) 平均绝对误差MAE评价方法

平均绝对误差MAE越小, 模型预测精度越高。不同的用水量预测对准确度的要求不同, 中长期的用水量预测甚至容许误差达到10%, 而短期的用水量预测的误差一般不能超过3%。

(2) 均方误差MSE评价方法

选择最佳模型的原则是使均方误差MSE最小。均方误差MSE是个绝对数值, 仅以此难以辨识模型的预测精度, 需结合其他评价标准对预测精度进行评价。

(3) 平均绝对百分误差MAPE评价方法

平均绝对百分误差MAPE越小, 模型预测精度越高。预测精度划分如表1所示:

(4) 后验差检验评价方法

指标C越小越好, C越小, 表示S1越大, 而S2越小。S1大, 表明历史数据方差大, 历史数据离散程度就大;S2小, 表明残差方差小, 残差离散程度小。C小, 表明尽管历史数据很离散, 而模型所得的预测值与实际值之差并不太离散。指标P越大越好, P越大, 表示残差与残差平均值之差小于0.6745 S1给定值的点较多。

4 结束语

总之, 对于给水管网系统的研究和应用, 对未来供水行业的方展有着巨大的作用, 尤其是对其中的水量问题的研究, 如果能继续深入地研究, 并且如果能充分的应用到给水系统的优化分析中, 会对供水管网系统优化起到巨大的推动作用, 供水行业将研究成果应用到实际的生产中, 那么对于供水行业来说, 无论是在社会形象的提高上——在供水的安全性和稳定性等问题上都能良好的解决目前的尴尬现状;还是在经济效益的增长上都有积极的推动作用——节约了基础设施的建设, 节约了运行费用。而这些都会推动建设节约型社会的步伐, 为祖国的建设贡献供排水人的一份力量。

摘要:由于城市用水量预测是一种对城市未来用水量的估算, 因此, 它与客观实际还是存在着一定的差距, 这个差距就是预测误差。预测误差和预测结果的准确性关系密切, 误差愈大, 准确性就愈低;反之, 误差愈小, 准确度就愈高。可见, 研究产生误差的原因, 计算并分析误差的大小, 是有很大意义的。这不但可以认识预测结果的准确程度, 从而在利用预测结果作决策时具有重要的参考价值, 同时, 对于改进城市用水量预测工作, 检验和选择恰当的预测方法等方面也有很大帮助。

关键词:给排水工程,水量预测,误差分析,精度评价,经济高效,经济效益,运行费用

参考文献

[1]张洪国, 赵洪宾, 李恩辕.城市用水量灰色预测[J].哈尔滨建筑大学学报, 1998, 31 (3) :32-37.

[2]徐洪福, 袁一星, 赵洪宾.灰色预测模型在年用水量预测中的应用[J].哈尔滨建筑大学学报, 2001, 34 (4) :61-64.

[3]袁一星, 兰宏娟, 赵洪宾, 等.城市用水量BP网络预测模型[J].哈尔滨建筑大学学报, 2002, 35 (3) :56-58.

[4]刘洪波, 张宏伟, 田林.人工神经网络法预测时用水量[J].中国给水排水, 2002, 18 (12) :39-41.

捷联陀螺漂移误差系数预测方法研究 篇2

捷联陀螺漂移误差系数预测方法研究

针对目前通用的均值估计法和AR(P)模型直接预测法对捷联陀螺漂移误差系数预测精度不高的情况,对AR(P)模型直接预测法进行了改进,建立了基于误差系数漂移量的.AR(P)模型,首先预测漂移量,进而预测出漂移误差系数值.通过仿真实例对3种方法的预测效果进行比较分析,结果证明本文提出的预测方法优于目前通用的两种预测方法.

作 者:焦巍 张国良 刘光斌 JIAO Wei ZHANG Guo-liang LIU Guang-bin 作者单位:第二炮兵工程学院,陕西,西安,710025刊 名:电光与控制 ISTIC PKU英文刊名:ELECTRONICS OPTICS & CONTROL年,卷(期):200613(2)分类号:V271.4 TJ76关键词:陀螺漂移 漂移误差系数 均值估计 AR(P)模型

分析师预测误差 篇3

风电功率预测是目前公认的解决风电接纳问题的有效手段, 精确的预测有助于风电调度工作的顺利进行, 提高风电接纳能力[1,2]。常用的风电功率预测以确定性的单值预测为主, 如时间序列自回归滑动平均 (ARMA) 模型[3]、卡尔曼滤波[4]、支持向量机[5]、神经网络模型[6]等。

目前国内风电功率预测水平有限, 以超短期预测为例, 国家对4 h超短期预测精度要求为不低于85%[7], 这一标准基本可以体现国内目前的超短期功率预测水平, 而短期预测平均绝对误差则保持在装机容量的25%~40%, 不是十分理想。

由于预测精度不高, 单值功率曲线形式的风电功率预测结果容易对风电调度工作产生误导作用, 间接增加系统调度负担。为了应对这一问题, 基于功率预测误差的风电功率不确定性预测近年来得到了更多的研究:

文献[8]~[10]在正态分布模型的基础上, 利用概率密度函数、蒙特卡洛随机模拟、基于分位数的非参估计等理论, 分析了风电功率预测误差的不确定性及对调度的影响, 具有一定的积极性。

然而, 上述研究成果对预测误差的描述没有脱离传统分布假设的束缚, 适应的场景有限。

本文以风电功率预测误差为研究对象, 通过引入预测误差经验分布假设, 实现对风电功率预测误差分布的描述, 并根据预测误差时间序列高阶AR模型对未来预测误差进行估计, 为确定预测结果置信度与预测结果修正奠定了基础。由于研究对象为预测误差本身, 该方法具有很高的适应性, 适用于各算法下的风电预测系统, 算例分析证明了所提方法的有效性。

1 预测误差的经验分布假设

以风电功率预测误差为对象, 对其概率分布进行描述可以确定预测结果的置信度及置信区间。实际应用中常用经验分布假设对预测误差真实分布进行拟合。当样本容量足够大时, 经验分布函数依概率收敛于总体分布函数。

1.1 预测误差的经验分布函数

设有预测误差样本值 (x1, x2, …, xn) , 作函数:

这里IA (·) 表示集合A的示性函数, Fn (x) 表示样本 (x1, x2, …, xn) 的经验分布函数。对任意实数x, Fn (x) 表示样本x1, x2, …, xn落入区间 (-∞, x]内的频数概率。由大数定律, 对于提取出的每组样本值, 当n→∞时, Fn (x) 依概率收敛到Fn (x) =P{X≤x}。因此当n很大时, 可以用Fn (x) 作为对实际预测误差分布函数的估计。

1.2 风电功率预测误差经验分布的适用性

根据出力水平将历史数据分为高、中、低出力水平的样本集并构造经验分布函数, 图1为中出力水平样本由统计频数表示的离散经验分布直方图。由经验分布图示可以看出风电功率预测误差并不完全是通常意义上的正态分布或者韦布尔分布, 可拟合性差。

经验分布不作随机变量服从某种特定分布的假设, 避免了拟合度的问题, 能够对预测误差的分布进行更精确的描述, 当样本数据量足够大时完全可以作为对实际分布的估计[11], 与传统特定分布相比, 约束更小, 适应性更强。

2 时间序列高阶AR误差预测模型

以风电功率预测误差本身作为预测对象, 对未来可能出现的预测误差进行初步的预测并修正, 能够提高风电概率预测的精度。本文选择时间序列高阶AR模型估计预测误差。

2.1 时间序列高阶AR模型

ARMA模型描述随机过程较为精确, 且建模简易。其中, AR模型参数估计通常只需求解一组线性方程, 并且只要选择足够高的阶数就能够达到要求的逼近精度[12]。本文采用高阶AR模型对风电功率预测误差进行预测。

式中:φi———回归参数, i=1, …, p;

ut———白噪声过程。

高阶AR模型参数的具体求解过程见文献[13], 此处不再详细介绍。

2.2 高阶AR模型对预测误差随机过程的适用性

ARMA模型在风速预测、风电功率预测领域应用广泛, 但是随着预测时间的增长, 预测将转换为纯自回归形式。此时, 高阶AR模型对ARMA模型的逼近精度足够高, 用高阶AR模型取代ARMA模型进行预测是完全可行的。另外, 高阶AR模型是线性模型, 运算效率高, 更具实时应用价值。因此本文选择高阶AR模型作为估计未来风电功率预测误差的核心算法。

3 基于经验分布假设的预测误差分析模型

根据上文中提及的经验分布假设与高阶AR模型可以对预测误差概率分布的特点进行初步的分析并得到置信区间结果, 然而上述描述过程包含的信息过于笼统, 无法有针对性的对不同条件下的风电功率预测误差分布进行详细讨论。

根据历史预测功率水平, 将样本集分为高、中、低三个出力水平, 并分别形成预测误差的经验分布函数, 可以实现对预测误差分布的针对性估计。

整个预测误差不确定性分析流程如图2所示。

4 实例分析

本文以内蒙古某风区2010年10月~2011年6月为样本对所提算法效果进行检验, 筛选处理后的有效样本数为1 035。这里选取其中时长约为16 h的功率区间预测结果说明本文算法的有效性。

在高阶AR模型修正的基础上, 根据预测误差经验分布函数展开预测误差不确定性分析工作。如图3, 图4所示为90%与50%置信度下的功率区间预测结果。

比较图3与图4可以发现, 随着置信度的降低, 功率区间上下界的间距逐渐减小, 对测量数据的包络度逐渐降低。根据经验分布假设, 当样本数量足够大时, 功率区间对测量数据曲线的包络程度近似于置信度, 即置信度为90%的功率区间理论上可以将测量数据曲线的90%包络。预测功率区间对测量数据曲线的包络程度越好说明越能对预测过程中的不确定性进行考虑。通过统计本文所提算法的功率区间包络情况, 可以得到风电功率预测的不确定性分析结果, 如表1所示。需要说明的是, 由于经验分布样本和预测样本数有限, 得到的实际包络度和理论置信度存在一定的偏差。

%

5 结语

大跨度桥梁施工误差预测方法 篇4

一、误差分析方法

由于施工过程中只能知道已施工梁段或以前施工阶段的理论标高和实际标高的误差Wk, 因此误差分析采用传统的Kalman滤波法。

二、施工过程中的误差调整方法及实例

1. 误差调整方法。

(1) 施工过程主要误差。一般施工过程中的误差主要有4种:参数误差、挠度计算误差、施工立模误差、量测误差。参数误差主要通过施工前参数试验进行修正, 修改模型中所采用的参数, 然后调整立模标高的理论值, 用来指导后续立模施工;挠度计算误差是在计算过程中采用的模型与实际情况有差别时产生的。施工立模误差与量测误差是在实际施工过程中发生的人为随机误差。

(2) 改进方法。本文, 笔者将施工立模误差与挠度计算误差 (模型计算误差) 区别开来, 采用两次Kalman预测法分别预测下阶段立模标高值和挠度计算值。在立模施工过程中, 对施工误差进行滤波并预测下阶段施工立模误差;在挠度观测过程中, 对挠度计算误差进行分析并预测下阶段挠度计算误差。首先, 根据前两个施工阶段的误差值, 通过Kalman滤波法对下一梁段可能出现的立模标高值进行预测。然后, 根据预测结果, 在下一梁段立模前, 调整立模标高, 使实际立模标高最大限度接近理想值, 即立模标高的理论值。再根据实际量测的立模标高误差, 预测下一梁段施工可能出现的误差, 并在施工前进行调整。最后, 按照施工梁段依次重复上述过程, 进行误差预测。

2. 实例。

本文以一座刚构桥为例 (130+2×275+130) , 进行理论分析。为了使仿真效果更加真实, 在理论计算得到的数据中加入各种随机误差的影响。对理论分析得到的状态变量加上均值为零的高斯白噪声, 用来模拟实际施工过程中的施工误差和程序计算误差等随机误差。考虑实际工程中出现误差的幅度, 取立模标高最大允许误差为0.03m, 量测最大允许误差为0.003m。由于篇幅有限, 本文仅做某跨几个悬臂阶段的分析, 仅为了证明本方法的适用性。

(1) 立模标高误差分析。表1列出了某端0~2号立模标高 (含噪声影响) 。从表中可以看出立模标高存在着较大的误差, 有必要对其进行调整。根据前两个施工阶段的误差值, 通过Kalman滤波法对下一梁段可能出现的立模标高值进行预测。根据预测结果, 在下一梁段立模前, 调整立模标高, 使实际立模标高最大限度接近理想值, 即立模标高的理论值。再根据实际量测的立模标高误差, 预测下一梁段施工可能出现的误差, 并在施工前进行调整。应用Kalman滤波法对施工立模误差进行调整, 调整结果见表2 (限于篇幅, 仅给出3个梁段的分析结果) :

单位:m

单位:m

从表2可以看出, 预测精度主要决定于对误差统计特性估计的准确性以及误差的大小, 即如果本阶段的误差与上阶段误差的大小相近, 那么预测值比较接近真值。因此在实际施工控制之前, 要先对误差的统计特性进行准确的估计。

(2) 挠度计算误差分析。采用两次Kalman滤波法, 在对施工误差分析的同时, 对挠度计算误差进行分析。并根据两种误差的分析结果, 调整立模标高, 减小两种误差对桥面标高的影响。为了计算方便, 假设挠度计算误差均方差为σ=0.00006x (x为悬臂长) 。挠度误差分析结果见表3。

单位:m

至此, 线形误差分析结束。接下来, 将其各项标高及误差进行统计, 见表4。表中, 误差值为经过施工误差分析调整后的实际标高与理论标高的差值, 差值为不进行施工误差调整, 仅按理论立模标高进行施工得到的实际标高与设计目标的差值, 可见经过施工误差调整可以有效减小施工误差对标高值的影响。

单位:m

三、结论

风电功率预测误差的风险评估 篇5

随着风电功率(wind power,WP)在电网中的占比不断提高,其不确定性及混沌特性对电力可靠性与经济性的挑战也更加严峻[1]。提高风电功率预测(wind power prediction,WPP)的精度是重要的应对手段,自20世纪80年代以来已发展成为涉及统计学、人工智能、气象学等多个学科的综合课题[2]。

可以根据是否分别预测风功率与风/电转换的特征,将WPP分为间接预测与直接预测;或从建模机理上分为物理方法与统计方法。数学预测模型有线性和非线性之分。线性方法有持续模型(persistence model)[3]、考虑风速时序性和自相关性的自回归移动平均(auto-regressive and moving average,ARMA)模型[4,5]及其各种改进算法[6,7]、卡尔曼滤波法[8]和灰色预测模型[9]等,其中以ARMA模型应用最广。非线性方法包括人工神经网络(artificial neural network,ANN)[10,11]模型及其演变[12,13]、模糊逻辑(fuzzy logic)[14,15]模型、支持向量机(support vector machine,SVM)[16]和其他人工智能算法[17]等,其中以ANN模型应用最广。

不论是预测方法的改进,还是WPP的正确应用,都必须基于对预测结果的评估。预测误差是指预测值偏离真实值(或实测值)的程度,包含系统误差、随机误差和粗大误差。前两类属于不可避免的正常误差,后一种为能够避免或剔除的非正常误差。预测误差的评估指标应能反映各个案例的预测误差,包括对某个时刻上的或某个时段内的预测,可表示为有量纲的绝对值指标和无量纲的相对值指标。

目前对风电预测误差的评估原则基本上都从误差均值的视角出发。由于风电在大多数情况下处于平稳或缓慢变化的过程,故大误差的概率较小,并不会对基于平均观点的误差评估结果产生显著影响。发生最大误差的点概率总是趋于零值,显然对均值的影响不大。但一旦发生大误差,对电网运行的影响却很大。

对间歇时段的预报误差可能相差数小时,而严重影响电力可靠性及经济性[1]。例如,未能准确预测到风速骤降至切入风速以下的时间段,而需要投入对等容量的常规备用机组,也可能由于位于临界群的双馈异步风力发电机停止运行,而位于余下群的常规备用投入运行,或者由于位于余下群的双馈异步风力发电机停止运行,而位于临界群的常规备用投入运行,系统稳定裕度都可能降低[18]。

由于WPP的正误差与负误差以不同的方式影响电力可靠性及经济性,而当前的评估指标却都基于绝对值概念及平均的准则,例如,平均绝对误差(mean absolute error,MAE)[6]、平均绝对百分比误差(mean absolute percentage error,MAPE)[13]及均方根误差(root mean square error,RMSE)[17,19]等(见附录A)。MAPE也被译为平均百分比误差[20]、绝对平均误差[21]或平均绝对相对误差[22],MAPE的另一种英文名称是平均相对误差(mean relative error,MRE)[23]。此外,预测误差与其造成的后果之间并非呈现线性关系。因此对于WPP误差,上述传统的评估指标既不能正确反映误差符号的影响,也不能正确反映误差影响的非线性[24]。

本文在区分WPP正负误差的基础上,提出其风险评估指标。据此,可将其对安全性、充裕性、经济性等多目标的影响统一量化为以货币单位为量纲的风险成本,包括小概率高风险的预测误差对系统造成的影响。实际算例表明,该指标简明有效且物理意义明确。

1 对WPP误差评估指标的要求

1.1 WPP误差指标的数学特性

无论要比较或改进预测方法,都需要通过其误差值的评估函数来评估预测的效果。为了明确地判断优劣,即使采用多个评估函数,也需要将各函数给出的不同数值综合为唯一的指标值。

评估指标应具有可观性,即多次预测中的任何一个误差的改变都能引起指标值的变化。评估指标还应具有可控性,即评估指标值的改善一定代表着预测结果的改善。为了能据此对误差的评估函数进行优化,并改进预测方法,误差评估函数必须单调地反映预测结果的优劣。

1.2 WPP误差指标的物理含义

一方面,WP时间序列的波动性、间歇性和随机性进一步加强了WPP误差的不确定性;另一方面,WPP使WP的不确定范围降低到WPP的最大误差区间,从而大大减小了WP的不确定性对电力系统稳定性、充裕性及经济性的影响。因此,值得关心的是WPP的上述影响,而不是WPP的本身。例如:对于低于切入阈值的风速,一方面由于风机均不工作,因此其预测误差并不重要;另一方面由于其预测误差不一定小,特别是用相对误差评估时。设想有2个预测方法,在风速的全部范围内的整体误差指标相同,但分别在大、小风速下有更好的精度,那么哪一个更适合于WPP呢?

风能的间歇性使其实测值或预测值都可能接近或等于零值,故不宜采用基于相对值概念的评估指标。此外,WPP的正误差及负误差影响电力可靠性及经济性的方式不同,故误差评估指标必须予以区别。

2 WPP传统评估指标的局限性

2.1 传统评估指标

MAE,MAPE和RMSE等传统评估指标从不同方式的平均观点来反映预测结果的绝对值误差,并认为预测效果随着指标值的降低而改善。

文献[15]将MAE和RMSE分别标幺化,得到归一化平均绝对误差(normalized mean absolute error,NMAE)和归一化均方根误差(normalized root mean square error,NRMSE);文献[25]用χ2统计量作为WPP误差的评估指标。

文献[26,27]比较了各单项指标MAE,NMAE及RMSE等作为评估指标时的评估结果,发现它们之间存在不一致的结论。

所有这些传统的评估指标都具有下述缺陷:(1)绝对值相同的正误差与负误差产生相同的后果;(2)各次预测结果的误差对指标值的影响与该误差的绝对值线性相关;(3)不能反映实际系统对预测误差承受能力上的强非线性。

为了克服不能区别对待正负误差的缺点,文献[5]将MAE指标分为预测结果偏冒进时的MPE(mean positive error)和预测结果偏保守时的MNE(mean negative error)。但并未解决误差时正时负的WPP序列的评估问题。

当风速序列较平稳或者规则变化时,各种WPP方法的误差一般都不会大。换句话说,WPP大误差往往发生在风速序列非常不规则,甚至混沌变化时。假设被测风速序列的样本集正确地反映了其概率分布,那么强波动、强间歇性时段的概率相对于整个时域来说一般并不会太大,但往往造成与其概率不成比例的严重后果,而传统评估指标却往往掩盖了这些小概率的预测大误差的影响。这就造成平均误差虽小,却与大误差个案的共存,并经过稳定性与充裕性问题的非线性放大,引入停电风险。在风电穿透率很大,而电网稳定性或充裕性裕度很小时,此类小概率大误差事件的风险不能忽视。

文献[28]指出:以RMSE最小化为目标函数来优化预测方法,其本质是误差分布的方差最小化,仅适用于预测误差呈高斯分布的特殊情况,而不能反映一般WPP误差分布的偏度、峰度等信息。但该文提出的基于熵函数概念的评估指标MEEF(minimum error entropy with fiducial points)仍然无法计及小概率高风险的预测误差对系统的影响。

2.2 评估预测误差序列的传统方法

误差序列是将误差值按时间顺序排列起来的离散序列,常用的测度为:均值、中位数、最大值、最小值、标准差、偏度、峰度等。它们从不同侧面描述误差序列的分布特性,但若要严格评估预测结果对系统的影响则应计及所有的样本,而这些传统的评估指标都无法实现。

均值和中位数都是反映一组数据的中心位置的主要测度。均值是全部数据的算术平均;而中位数是位于一组按大小排列的数据中间位置上的那个数据。均值易受数据极端值的影响,而中位数则不然;当数据分布不对称度大时,可选用中位数。在误差的评估比较中,均值和中位数越接近零越好。

最大值反映数据中的极端情况。它在很多评价体系中并不受重视,但在WPP中却可能严重影响备用容量的安排,并应分别对待正最大值和负最大值。其值越接近零越好。

标准差是应用最广的离散程度的测度,其值越小越好。

偏度反映了误差序列在均值两侧的非对称性。正态分布呈对称状,偏度为零。若分布右偏(或左偏),即右侧(或左侧)拖尾更长,则偏度为正(或为负)。风电预测的误差序列大多呈右偏分布,其右拖尾部分对应于小概率大误差的预测结果。

峰度量度了误差序列的非平坦程度。正态分布的峰度为3;若峰度大于(或小于)3,则比正态分布“高瘦”(或“矮胖”)。WPP误差序列的峰度一般大于3,其值越大越好。文献[29]指出风电预测误差序列的分布并不符合高斯函数,而更接近于Beta函数,其峰度变化幅度较大,在3到10之间。

2.3 多指标并行评估

多指标并行评估方法,同时采用了不同的指标分别评估,其中,MAE和RMSE仍占据重要地位。这类方法并没有解决当各指标的结论不一致时如何决策的问题。

例如,文献[23]同时采用了MAE、RMSE及误差分布直方图来评估WPP误差,并用峰/谷点的预报准确度来反映对大误差预测的可信度。此外,还用相关系数反映预测序列与实测序列之间的正线性相关性(见附录A)。文献[30]也并行地采用了MAE、RMSE、“准确率”及“合格率”等指标。

2.4 综合评估方法

若在多指标并行评估的基础上,以某种合理的方式融合各自的评估结论,可以构成WPP结果的综合评估指标。但它既给出了更全面评估WPP结果的可能性,也可能由于融合方式的缺陷而引入更大的随意性。此外,基于多项传统指标的综合评估体系不可能克服其共同的本质缺陷。

3 WPP误差的风险评估指标

3.1 WPP正负误差的不同含义

在t0时刻预测i时刻的WP,以实测值为比较基准来定义预测误差ei:

式中:和yi分别为预测值和实测值。

正误差ei>0意味着风电被过高地估计;负误差ei<0意味着风电被低估。两者对于电力系统可靠性及经济性的影响规律完全不同。

需要指出的是,基于绝对值概念的传统评估指标[31]并不关心预测值和实测值哪个作为比较基准。与文献[28,29]以预测值为比较基准的定义不同,本文的定义更合理。

3.2 WPP误差的风险评估指标

设考察范围内有n次预测,对应的各个误差值构成误差序列为:

而误差ei使电力系统的可靠性控制成本增加了ci(ei),则整个误差序列对应的控制成本增量C很好地反映了预测质量,即

将上述概念扩展到大量的统计结果。假设统计得到:预测误差为ek的概率是pk(ek),将误差概率的分布函数表示为P(e);设预测误差为ek时的控制成本增量为ck(ek),将其分布函数表示为C(e)。P(e)和C(e)都不是对称函数,其计算方法将在下文讨论。电力系统增加的可靠性控制风险成本为P(e)与C(e)的乘积对于e的积分,其量纲为货币单位。

为此,定义WPP评估指标R为电力系统为保证其可靠性而增加的控制风险成本:

3.3 风险评估指标的特点

所提出的风电预测误差的风险评估指标克服了当前各种指标的许多缺点,具体如下。

1)该误差评估指标以货币单位为量纲,从风险的角度定量地综合反映了WPP误差对经济性与安全性的影响,具有清晰的物理学概念及经济学概念。

2)指标值单调地反映了实际系统对预测误差承受能力上的强非线性;R值越大,风险越大。

3)可以区分正、负误差对电力系统的不同影响。

4)只需要一个标量就涵盖了众多不同的传统评估指标的视角。

5)不但可以感知整个考察时段内的任何一次预测误差的微小变化,而不会被埋没,并可用以指导对预测方法的改进。具有很强的可观性与可控性。

6)该风险成本可与其他成本直接相加,解决了“不必考虑小概率预测误差事件”与“必须重视高损失事件”相矛盾的困惑。

4 WPP误差评估的风险指标计算

4.1 误差序列的概率分布函数P(e)的计算

文献[29]采用Beta函数来描述P(e)的典型分布,文献[28]认为不宜直接用某一典型的分布函数来描述。事实上,P(e)的分布不但与实际(或样本)风速的概率分布有关,还与被评估的预测方法密不可分。因此,“典型分布”的说法只能用于实际风速,而不能针对预测误差。

对于特定的预测方法,只要样本有代表性且数量足够多,就能得到该预测方法的P(e)。为了减少对样本数的要求,一般用蒙特卡洛法采样。文献[32]采用了重要值采样方法来协调样本数与小概率高风险事件之间的矛盾。

当样本数不多时,可用直方图形式代替连续的分布函数P(e),并采用式(4)的离散形式评估风险。

4.2 误差代价函数C(e)的计算

文献[33]采用了WPP误差序列符合高斯分布的假设,按其标准差来间接估算备用容量过度配置及切负荷量。文献[34]则假设误差序列服从Beta分布,风力发电商需承担用紧急备用代替主动常规备用所增加的风险。文献[35]综合考虑负荷预测与WPP的不确定性,提出备用容量的计算方法。上述各方法除了所用的假设条件太强外,还无法计及大误差的影响中所包含的强非线性。

代价函数值C(e)的计算与误差e的符号有关,并针对指定的容量事件集。

对于正误差(预测值大于实测值),应计算该次冒进的预测所导致的非常规控制代价。若据此安排正常运行的常规机组,届时就会产生实时发电的容量不足而动用备用容量,甚至不得不采用切负荷等高代价的紧急措施。与此同时,由于为应对风电波动而安排的备用容量正比于y^i,则可能偏多。两者的综合影响需要具体分析。

对于负误差(预测值小于实测值),若据此安排正常运行的常规机组,届时就会发生被迫弃风或常规机组的强迫停运。与此同时,为应对风电波动而安排的备用容量则可能偏少。两者的综合影响需要具体分析。

要在代价函数计算中全面地反映上述因素,还需要相当的开发工作。但研究过程不妨逐渐增加其完善性。

5 仿真分析

5.1 算例描述

采用宁夏某风电场2009年3月的风电场出力数据,采样间隔为1h。用其前550h的数据识别模型参数;用后200h的数据作为评估预测误差的实测值,检验模型预测的结果,如图1所示。

5.2 基于最小二乘的时间序列预测

ARMA法集成了自回归(AR)模型与滑动平均(MA)模型,是研究时间序列的重要方法。它利用时间序列中的滞后项和随机误差项来拟合当前值及预测未来值。为消除风电序列中的非平稳成分,采用差分技术对数据系列预处理,从而将ARMA模型扩展为自回归求和移动平均(auto-regressive integrated moving average,ARIMA)模型。

选择6组预测模型,即ARIMA(1,1,1),ARIMA(2,1,1),ARIMA(1,1,2),ARIMA(2,1,2),ARIMA(1,1,3)及ARIMA(2,1,3),下面分别称为模型1,2,3,4,5,6。根据图1中前550h的数据,按最小二乘规则分别识别各模型的参数,结果见附录B。然后分别用上述模型预测后200h的数据,并用不同的常用指标分别评估各模型预测误差的风险。

以模型1为例,图2给出其实测曲线与预测曲线,图3给出其误差序列曲线。图中用圆形标出间隙性特征和小概率的较大误差。

5.3 基于传统评估指标的误差分析

各传统评估指标的比较结果如表1所示。

最常用的3种传统指标中,RMSE认为模型4最好,MAE认为是模型2,而MAPE则认为是模型1,其他指标也给出了互异的排序。除模型5外,其他模型都至少被一种指标列为第1,而模型5也被3种指标列为第2。反过来看,所有的模型都有被列为最末或次最末的机会。显然,每个指标都具有其片面性。

5.4 基于风险概念的评估指标

基于风险概念的评估指标,仅用一个标量就可以反映所有单个预测样本的误差对系统可靠性与经济性的影响。因此,不存在多解的混淆。

对于较小的样本空间,可以用概率直方图代替连续的概率分布函数。以模型1为例,其预测误差的概率直方图见图4,其中用圆形标出了较大误差的样本,其概率一般较小。将各次预测的风险值累加得到总风险值。为便于计算,误差代价函数C(e)的计算中,对正误差情况,考虑为应对风电波动而多安排的备用容量成本;而对负误差的情况,则仅考虑风电场的弃风损失。

不失一般性,设按照风电预测值的比例x配置应对风电波动性的备用容量,其成本为A;设风电场弃风损失为B。因此,正误差对应的代价增量ci为Aeix;负误差对应的代价增量ci为eiB。风险评估指标R的计算表达式如下:

式中:R+和R-分别表示在预测样本为正、负误差下,为保证风电接入后系统可靠性而增加的控制风险成本;l和m分别为产生正、负误差的预测样本数。

本算例中x取30%,各模型下的预测误差风险评估指标计算结果如表2所示。

当A=10B,即备用成本大大高于弃风成本时,模型6的预测效果最优;当A=2B,即备用成本略高于弃风成本时,模型4变为最优,模型6则相对最差;当A=B,即备用成本与弃风代价相当时,最优模型从模型4变为模型5;当A=0.1B,即弃风代价大大高于备用成本时(例如受政策或舆论影响),模型5仍然保持最佳的位置。

可见,由于WPP的正、负误差的(广义的)经济代价不同,对预测方法会有不同的偏爱。

6 结语

WPP误差的风险评估指标不但区分了正负预测误差的不同影响,计及了小概率高风险的预测误差对系统的影响,也可以将预测误差对系统可靠性及经济性的影响统一考虑,更合理地应用预测结果,支持决策的优化。所建议的评估指标深刻地反映了正负预测误差影响电力系统的不同机理,具有明确的物理与经济的含义。通过仿真算例表明了其对决策支持的意义。

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx)。

摘要:归纳对风电功率预测误差的评估指标要求,以及常用评估指标的缺陷。在区分风电功率预测正误差及负误差对电力可靠性不同影响的基础上,提出基于风险的评估指标及计算方法。针对由预测误差而定义的功率扰动事件,取该事件的概率及其一旦发生后的损失的积分值为指标。该指标具有货币的量纲,可以作为误差的风险成本而与其他成本直接累计。从而消除了面对小概率大误差算例,在“不必考虑小概率事件”与“必须重视高损失事件”之间权衡的困惑。结合宁夏某风电场的实际算例验证了其可行性与有效性。

足球机器人预测误差反馈导航算法 篇6

机器人足球比赛是集机器人技术和足球运动于一体具有高度挑战性的项目,包含了传感器信息提取与融合、图像识别、无线通信、动态决策、行为控制等诸多技术环节[1],而运动导航控制是最基本、最重要的一环,它是完成射门、截球、跑位等技术动作的基础,导航控制的目的就是使机器人快速、精确地从初始点到达目标点,导航控制的性能会对技术动作的完成效果产生很大的影响,从而影响比赛结果。现在较常用的导航控制方法主要有PID控制,PID模糊控制[2,3,4],还有轨道追踪方法如文献[5-6],以及在预测机器人航向变化趋势基础上提出的预估控制方法[7]和基于神经网络的预测控制方法[8]。本文在预估控制方法的基础上,提出了首先预测机器人的运动状态进行预测控制,然后对控制命令进行误差修正的机器人导航算法。

1 比赛中球、机器人的几何模型与物理模型

不论在实体机器人控制过程中还是在仿真平台进行控制模拟实验,都要以机器人的几何特征和运动学特性为基础。仿真比赛[9]中球的物理模型为一个直径5 pixels的桔红色高尔夫球,与轮式机器人相比质量很小,且只能做直线运动。球在机器人的推动作用下开始加速运动,当速度最大时球已经脱离了推动它的机器人,然后在与地面摩擦力作用下作减速运动,并最终速度减为零。球的运动学方程[9]为:

式中:Vt,Xt,Yt为t时刻球的运动速度与位置坐标;Vt-1,Xt-1,Yt-1为t-1时刻球的运动速度与坐标;ξ为由摩擦引起的加速度;Δt为两时刻间的时间间隔;θt-1为t-1时刻球的运动方向。

机器人外观上是一个两轮正方形小车,在比赛之前可以为每个球员选择不同的表面图形以易于识别,机器人在前进过程中,它的运动不仅受到摩擦力的影响,更主要是取决于马达电机的转速。通常把电机转速分为127级(-127~127),当转速为负值时,电机反转,机器人向后运动。如果两个轮子的线速度一样,则机器人保持原方向角作直线运动,否则它会转弯作曲线运动。根据运动学知识,可以算出机器人转弯时的圆弧半径,以确定机器人在下一时刻应在的位置。机器人做曲线运动的动力学方程[9]为:

式中:VM取左、右轮速中绝对值较大的一个;Vm取左、右轮速中绝对值较小的一个;R为机器人转弯的半径;ω为机器人的角速度;L为机器人小车的宽度;V为机器人的线速度;β为在时间间隔T内机器人转弯的角度。

根据上述机器人运动学式(2),可以计算机器人小车在控制命令VM与Vm的作用下经过时间间隔T后的坐标位置(XT,YT),假设机器人的初始位置坐标为(X0,Y0),相对x轴正方向的初始偏置角度为α0,则:

(1)当机器人向前运动且左轮速度大于右轮速度时,或者当机器人向后运动且右轮速度大于左轮速度时,即机器人的运动轨迹为相对某圆心点的一段圆弧曲线且顺时针方向运动时(如图1所示),(Xt,Yt)计算公式为:

(2)当机器人向前运动且右轮速度大于左轮速度时,或者当机器人向后运动且左轮速度大于右轮速度时,即机器人的运动轨迹为相对某圆心点的一段圆弧曲线且逆时针方向运动时(如图2所示),(Xt,Yt)计算公式为:

2 预测误差反馈导航算法

在机器人实际移动过程中或者是在仿真平台的实验过程中,导航控制中预测角度与目标角度存在偏差(如图3所示),传统PID控制函数在每个采样周期或者接收仿真平台的环境数据结束后根据目标方向与采样方向的偏差值来计算控制命令,从而使机器人朝目标方向运动,然而在机器人进行数据采样从而生成控制命令的时间里它在上一周期发出的指令将发生作用,即指令滞后一个周期执行[8],或者在仿真平台中“每个机器人和球根据上一周期的运动状态、本身的机械特性和它接收到的控制字计算出新的位置、角度和速度”[7],也就是说根据第一个采样周期接收到环境数据生成的控制命令要在第二个周期才能对机器人的运动状态发生作用,然后在第三个周期显示出来或者在采样数据中体现出来。所以,根据采样数据直接计算得出的控制命令不能实现对机器人的精确控制。预测误差反馈导航算法的基本思想是根据机器人本周期采样数据得到球的运动状态以确定目标点,再依据机器人的运动状态包括坐标、角度、线速度、角速度和机器人运动学模型预测下一周期机器人的位置坐标和方向角,然后用传统的PID控制函数计算得出机器人朝目标点运动的控制命令,最后根据式(2)~式(4)预估计控制命令作用后机器人方向角与目标方向的偏差及控制命令对机器人线速度大小的影响对控制命令做出修正。具体流程如图4所示。

对控制命令的修正一般首先考虑角度偏离误差,如图4所示,假设预测机器人在初始PID控制命令作用后角度为θ1,目标方向角为θg则对控制命令的修正如公式(5)所示:

式中:k一般根据机器人的转角性能取0~1之间;VL和VR为初始控制命令;VL′和VR′为预测误差修正后新的控制命令。当机器人方向角调整到目标方向时进而对速度误差做出修正,根据预测机器人在初始PID控制命令作用后的坐标Cp和的目标点坐标Cg的距离|Cg-Cp|修正方法如式(6)所示:

式中:根据机器人朝向当目标点Cg位于预测机器人坐标位置Cp前方时α取正,反之α取负,同时由于受机器人左右轮转速范围限制α大小取0~1之间。

因此本算法主要包含两个步骤的预测,一是对机器人下一周期状态的预测;二是对控制命令作用结果的预测,以及根据预测所进行的误差修正。在进行误差修正时不仅要考虑预测方向角与目标方向角度的偏差,同时也要保证机器人的线速度尽量高,在撞击球的过程中机器人的线速度越大碰撞就越激烈,球获得的加速度就越大,从而使机器人在比赛中具有强劲的进攻性能和稳固的防守能力。

3 实验结果

用上述方法在FIRA SimuroSot 11vs11的仿真平台上进行实验,并与客户端框架程序提供的传统PID算法进行比较,机器人运动初始坐标为(479,159),初始方向角0°,目标点坐标(900,610),目标方向角90°;用两种导航算法控制机器人朝目标状态运动时,记录各个采样周期机器人的位置坐标及方向角,结果如图5,图6所示。

由图5、图6对比可见,图6的机器人朝向目标点(target)运动的轨迹接近一条直线,较图5的曲线运动轨迹准确性更高;另外,在机器人起跑和靠近目标点(target)时,图6比图5花费的时间(即采样周期)更少,显示了更快的收敛速度。另外选取5个不同的目标点,目标方向角90°,机器人运动初始坐标为原点(0,0),初始方向角0°,比较两种不同导航方法所用时间,统计结果(时间单位:周期)如表1所示。

4 结语

本文在预测控制的基础上进一步增加了对控制命令作用效果的预测,从而对控制误差进行修正,保证了控制的准确性,提高了机器人向目标状态运动的收敛速度。仿真实验表明,该方法较传统PID控制方法在时间性和收敛性方面均表现出更优的性能。

参考文献

[1]杨林权.机器人足球竞赛与设计[M].武汉:华中科技大学出版社,2009.

[2]田琦,张国良,刘岩.全方位移动机器人模糊PID运动控制研究[J].现代电子技术,2009,32(5):131-133.

[3]徐建安,邓云伟,张铭钧.移动机器人模糊PID运动控制技术研究[J].哈尔滨工程大学学报,2007(6):115-119.

[4]刘祚时,邝先验,吴翠琴.基于模糊PID的足球机器人运动控制研究[J].工程设计学报,2006,13(8):224-227.

[5]郭路生,杨林权,吕维先.基于Bézier曲线的机器人足球射门算法[J].哈尔滨工业大学学报,2005(7):921-923.

[6]范宗涛,许东来.基于Hermite曲线的机器人足球射门算法[J].计算机与现代化,2010(8):55-57.

[7]龚建伟,黄文宇,陆际联.轮式移动机器人航向跟踪预估控制算法[J].机器人,2001,22(3):193-196.

[8]GU Dong-bing,HU Huo-sheng.Neural predictive control for a car-like mobile robot[J].International Journal of Robotics and Autonomous Systems,2002,39(5):2-3.

考虑预测误差的模型内插与外推 篇7

然而, 工程结构中通常包含各种不确定性因素:如不同批次材料的弹性模量、密度等参数。根据设计图纸不同批次加工得到结构的几何尺寸、结构在服役期间的多次拆装等, 为了弥补结构中不确定性因素带来的不安全性, 专家们在确定性模型中引入安全系数, 这是一种较粗糙地评价结构安全程度的方法[2]。现代模型验证与确认 (verification and validation, V&V) 是评估复杂数值模拟可信度的系统方法。考虑模型的不确定性是其一大特点, 考虑不确定性因素使得结构建模、仿真与确认面临更大挑战, 同时也使得基于模型V&V对结构设计及可靠性评估显得更合理[3—6]。现代模型V&V研究主要是针对缺乏全系统试验的复杂装备系统, 定量给出数值模拟置信区间, 故模型的内插外推是其中一个关键问题。总体来说, 模型的内插外推可分为参数空间和结构空间两大类[5]。

针对模型参数空间的内插外推问题, Roy等人[6]基于面积度量表示模型误差, 并在参数空间对其进行拟合;并以拟合曲线置信区间最大值作为预测点处的误差, 以此实现模型误差的内插外推。本文假定结构预测误差为正态分布, 其均值与标准差通过统计得到;再对均值与标准差进行函数拟合 (考虑拟合引入的误差) , 根据拟合函数并结合双层抽样得到预测点误差的置信区间, 并叠加上该预测点确定性的计算结果, 得到预测点关心量的置信区间。

1 模型不确定性与传播

一般地, 模型确认中的不确定性可以表达为

式 (1) 中:θ为模型不确定参数, ye (x, θ) 为物理试验结果, ym (x, θ) 为模型计算结果, εc为软件程序误差, εh为数值误差, δ为模型误差, εe为试验误差。

假如εc、εh和εe已通过模型验证与确认, 表明可忽略, 那么式 (1) 简化为

假定误差函数δ (x) 服从正态分布, 即有

为了得到误差函数的均值μδ与标准差σδ, 一般地, 可以根据各工况的多次试验数据与该工况确定性计算结果的差值统计分析得到。但采用最小二乘法对μδ与σδ进行函数拟合时, 会引入拟合数据模型的误差 (不确定性) , 该不确定性可以通过拟合曲线的置信区间来反映, 相比模型误差的不确定性要低一层次;但没有证据能表明其对最终预测结果的影响可忽略, 因此建模时也需要考虑这一因素影响。

假定μδ与σδ为独立正态分布, 他们的拟合曲线上某点的95%置信区间上、下限分别是μδ+、μδ-和σδ+、σδ-, 则μδ与σδ的均值与标准差可以通过如式 (4) 求出。

根据上述分析结果, 可以通过双层抽样得到预测点处模型误差的样本, 即先通过蒙特卡罗 (MC) 抽样得到μδ与σδ样本, 再根据抽样结果并通过MC抽样得到预测点处模型误差样本, 并分析得到预测结果的95%置信区间, 最后叠加上预测点确定性的计算结果, 得到该点关心量的95%置信区间。

2 实例研究

2.1 实验设计

研究对象为悬臂梁如图1所示。梁的材料为钢, 厚度为15 mm, 在固支端有六个直径为9 mm的通孔, 模态实验时通过三个M8的螺栓与基础相连。开展了多个拧紧力矩 (5 N·m、6 N·m、7 N·m、8 N·m、9 N·m、10 N·m、12 N·m、16 N·m、20 N·m) 下的模态实验, 采用力锤施加瞬态脉冲激励信号。实验共进行了5轮 (预紧力矩从低到高施加, 每轮实验完成后更换螺栓及垫片) , 每轮实验不重复。以拧紧力矩10 N·m为例, 得到梁的固有频率数据如表1所示。

不确定性建模使用拧紧力矩为6 N·m、7 N·m、8 N·m、10 N·m、12 N·m、16 N·m的实验数据, 根据数学模型对拧紧力矩5 N·m、9 N·m、20 N·m的结构频率进行内插与外推, 并与实验数据进行比较确认。

2.2 结构有限元模型与参数识别

针对图1所示的梁结构, 在ANSYS中采用BEAM3二维梁单元建立梁悬臂部分的有限元模型, 采用两个COMBIN14弹簧单元分别模拟螺栓连接固支端的平动刚度Kt和转动刚度Kr, 所建立梁的有限元模型如图2所示。这样, 悬臂梁根部装配的不确定性就转化为两弹簧刚度参数的不确定性。

针对每个工况模型中弹簧刚度的识别, 可以根据结构的模态试验结果, 通过优化等方法对这两个参数进行识别。由于该结构较简单, 可直接调用ANSYS的优化模块, 识别刚度参数, 定义目标函数如式 (5) 所示:

式 (5) 中, fci、fti分别是结构固有频率的计算值和实验值。

根据上述思想, 识别得到不同预紧力矩各工况的平动刚度Kt和转动刚度Kr, 它们的散点图如图3、图4所示。

根据图3、图4, 可假定平动、转动刚度的均值与拧紧力矩之间是指数函数关系, 拟合得到各自均值的函数如式 (6) 。

式 (6) 中, T为拧紧力矩。

2.3 率误差模型

根据式 (6a) 、 (6b) 计算得到拧紧力矩为6 N·m、7 N·m、8 N·m、10 N·m、12 N·m、16 N·m时梁结构有限元模型中的平动刚度和转动刚度, 并代入有限元模型中计算结构前三阶固有频率。将各拧紧力矩下的试验结果减计算结果, 得到频率误差, 不同拧紧力矩的频率误差即为公式 (2) 中的误差函数δ (x) 。对频率误差进行统计分析, 得到频率误差的均值与标准差, 根据拧紧力矩对他们的影响趋势, 可假定他们之间的函数关系为y=axb+c。对他们进行拟合, 拟合曲线如图5~图6所示, 各拟合函数的系数如表2所示。

注:μf1-δ、μf2-δ、μf3-δ与σf1-δ、σf2-δ、σf3-δ分别是结构前三阶频率误差的均值与标准差。

2.4 频率的内插与外推

根据结构前三阶固有频率误差的均值与标准差的函数关系, 内插外推得到5 N·m、9 N·m、20 N·m时频率误差均值与标准差的95%置信区间, 假定其为正态分布, 再根据式 (4a) ~式 (4d) 计算误差均值与标准差的均值与标准差。采用双层嵌套MC抽样, 得到预测点处结构前三阶固有频率误差的样本, 进而分析得到频率误差的95%置信区间。再根据式 (6a) 、式 (6b) 计算得到拧紧力矩为5 N·m、9 N·m、20 N·m时梁结构有限元模型中的平动刚度和转动刚度, 并代入有限元模型中计算结构前三阶固有频率, 最后叠加上频率误差的95%置信区间得到预测点处结构前三阶固有频率的95%置信区间, 与实验结果的比较如图6所示 (图中每组线的左边实线为预测结果的95%置信区间, 右边实线为实验结果的上下限) 。

从图7可以看出, 针对内插点9 N·m和外推点20 N·m, 预测结果的95%置信区间覆盖了实验结果区间, 而对外推点5 N·m, 预测结果的95%置信区间不能覆盖实验结果区间, 主要由于拧紧力矩为5 N·m时, 悬臂梁频率特性表现出更强的非线性。当外推点处出现较强非线性时, 针对此时预测效果不好的情况, 可以在靠近5 N·m处 (如5.5N·m) 增加实验, 用来修正或重建数学模型, 以达到较好的预测效果。

3 结论

本文针对参数空间的内插外推问题, 考虑预测误差具有不确定性, 对预测误差的均值与标准差进行函数拟合, 同时考虑函数拟合带来的不确定性 (函数关系式中系数的置信区间) , 通过双层抽样得到预测误差的置信区间, 进而叠加上预测点确定性的计算结果, 得到预测结果的置信区间。将该方法应用到根部柔性悬臂梁在连接螺栓拧紧力矩空间前三阶频率的推断预测, 展示了该方法在模型确认过程中内插外推的有效性, 可为其它工程结构的不确定性预测推断提供借鉴。

摘要:对结构进行评估时, 常需要利用模型的内插与外推结果, 且模型的不确定性也是需要考虑的一个重要因素。针对模型参数空间的内插外推问题, 基于确定性计算模型并联合多次试验结果, 计算得到预测误差的不确定性;接着对预测误差的均值与标准差进行函数拟合;并且考虑函数拟合带来的不确定性。通过双层抽样分析得到预测误差的置信区间, 再叠加上预测点确定性计算结果, 进而得到预测结果的置信区间。最后通过不同拧紧力矩下某根部柔性悬臂梁的内插与外推应用, 检验了该方法的有效性。

关键词:预测误差,内插,外推,不确定性

参考文献

[1] Mottershead J E, Friswell M I.Model updating in structural dynamics:a survey.Journal of Sound and Vibration, 1993;167 (2) :347 —375

[2] 王善, 何健.导弹结构可靠性.哈尔滨:哈尔滨工程大学出版社, 2002:36—80

[3] Ladeveze P, Puel G, Deraemaeker A, et al.Validation of structural dynamics model with uncertainties.Comput.Methods Appl.Mech.Engrg, 2002;191:1639—1675

[4] Moens D, Vandepitte D.A survey of non-probabilistic uncertainty treatment in finite element analysis.Comput.Methods Appl.Mech.Engrg.2005;194:1527—1555

[5] Oberkampf W L, Roy C J.Verification and validation in scientific computing.Cambridge:Cambridge University Press, 2010

分析师预测误差 篇8

近年来, 风电作为可再生能源的重要组成部分和技术最成熟的新能源利用方式, 在电网中的渗透率急剧增长。由于风电出力固有的随机性和间歇性, 与传统负荷预测结果相比, 风电功率预测结果的误差较大, 这就必然会给电力系统调度与控制、安全与防御等各方面带来不利影响[1,2]。在目前国内外的研究中, 风电功率预测误差一般由历史上风电运行的实际数据与预测数据对比统计得到, 属于事后统计误差。实际上, 在事前 (如日前) 如果能估计出风电功率的预测误差, 将会有巨大的意义和作用。

近些年, 国内外在事前估计风电功率预测误差方面做了一些有价值的工作。文献[3]提出了一种基于风过程方法的风电功率预测误差估计方法。该方法根据风特性的不同, 对风进行分类, 估计风电功率预测误差。该方法需要对该地理区域的风过程特性进行详细的分析。文献[4]基于历史数据寻找日前预测数据的相似日, 通过聚类分析得到相似历史时段, 然后分析相似历史时段数据得到当前预测数据的偏差分布, 此方法需要大量的数据统计, 计算量较大。文献[5]认为预测误差与风速、风向和功率有关, 基于历史数据序列进行超短期风电功率预测, 建立了基于独立分量分析的条件概率模型, 用于计算预测结果的不确定性。文献[6]建立了量化风电出力预测不确定性的统计模型, 分别应用delta和bootstrap方法为神经网络预测建立了满足规定的置信水平的预测区间。文献[7]认为功率预测的不确定性与功率曲线的斜率和风速预测的历史平均误差成正相关, 对历史风速预测误差进行统计。该方法需要风电场的历史风速预测数据。文献[8]综合了基于多种预测方法的多个预测软件的预测结果, 通过分析不同预测软件的预测结果分布, 进行风电功率预测误差估计, 因此该方法要求有多种对应的预测软件。文献[9]针对每个风电场研究风电功率预测误差分布, 根据各个风电场之间的相关性建立风电功率预测误差的统计模型。该方法需要每个风电场的历史运行数据。文献[10-12]根据风电历史运行数据, 分别使用高斯分布模型、柯西分布模型、贝塔概率密度分布模型拟合风电功率历史预测误差, 然后估计未来预测结果的预测误差。但是他们忽略了风电运行的近期特性。

在影响风电功率预测误差的因素分析方面, 国内外也做了一些定性分析。文献[13]指出风电功率预测误差不仅与预测方法有关, 还与预测周期及预测地点的风速特性有关。文献[14]指出改善预测方法可以有效减小预测误差。文献[15]认为风电场出力预测误差大小随着预测周期和出力水平的不同存在较大的差异。文献[16]得出了预测模型和数值天气预报是风电功率预测误差的主要来源的结论。文献[17-20]指出风速预测误差不仅与预测方法有关, 还与预测周期、预测点风速和波动程度有关。文献[21]从物理角度进行分析, 认为风速主要受大气运动作用的影响, 预测周期越长, 大气运动变化越剧烈, 风速波动越大, 预测结果的准确度就会降低。

总体而言, 在估计风电功率预测误差方面, 现有方法大多集中在理论研究方面, 但将其应用于工程实践还存在一定的难度。本文提出一种基于数据特征提取的风电功率预测误差估计方法, 通过提取风电运行历史数据和风电预测数据的特征, 确定影响风电功率预测误差的各种因素并量化其权重系数, 建立风电功率预测误差的估计模型。与已有方法相比, 本文提出的方法所需数据来源可靠且容易获得, 具有较高的工程实用价值。

1 基于数据特征提取的风电功率预测误差估计整体思路

本文所提出的基于数据特征提取的风电功率预测误差估计方法, 主要通过分析风电运行历史数据和风电功率预测数据的具体特征, 估计其日前预测误差的范围。其流程图如图1所示, 具体分为如下几个步骤。

步骤1:分析影响风电功率预测误差的主要因素。对大量的风电运行历史数据进行统计分析, 通过各种因素与风电功率预测误差之间的相关性分析, 提炼出影响风电功率预测误差的主要因素, 包括:风电功率幅值、日前预测出力波动性、近期风电出力平稳性和预测方法。由于在实际工程系统中, 对于一组由风电功率预测系统提供的预测数据, 其预测周期一般是一个恒定值, 因此, 本文并没有分析风电功率预测周期对预测误差的影响, 当然也可以将其引入, 其分析思路可以在本文的基础上扩展。同时需要说明的是, 一些电网受限因素 (如弃风) 会使得实际风电功率数据与预测数据之间存在很大偏差, 从而影响本文的数据源, 即影响历史数据的统计误差。本文将这些受电网约束影响的数据源作为异常运行数据处理, 程序中会自动识别并尽量剔除。

步骤2:建立风电功率预测误差估计模型。通过统计风电历史运行数据, 提取风电功率数据特征, 量化步骤1中各个影响风电功率预测误差的主要因素, 其中, 日前预测出力的波动性用预测曲线的斜率表示, 近期风电出力平稳性用近期数据的标准方差表示, 同时, 用近期预测精度衡量预测方法对预测误差的影响, 并采用多元线性回归分析方法建立风电功率预测误差估计模型。

步骤3:在线和离线计算模块实现。为了减少程序的在线运行时间, 增加本方法的工程实用性, 将本方法解耦为离线计算和在线计算两个独立模块, 最终实现风电功率预测误差估计。

2 风电功率预测误差影响因素分析

本节利用具体数据, 对风电功率幅值、日前预测出力的波动性、近期风电出力平稳性和预测方法与风电功率预测误差的相关性进行了统计分析。数据来源为比利时电力运营商Elia公开的2013年9月的风电运行数据[22]。风电预测误差采用中国电力行业标准《风电功率预测功能规范》对风电功率预测误差计算方法的规定[23], 采用第j天的日前平均绝对误差EMAE, j衡量风电功率预测误差, 如式 (1) 所示。相关性程度采用皮尔逊相关系数定义, 用r表示, 如式 (2) 所示, -1≤r≤1, r=-1表示两者负线性相关, r=1表示两者正线性相关, r=0表示两者没有线性关系。

式中:PMi和分别为i时刻的实际风电功率及其平均值;PPi和分别为i时刻的预测风电功率及其平均值;Vcap为风电场的开机总容量;n为所有样本的个数。

2.1 预测出力波动性对预测误差的影响分析

风电功率日前预测出力的波动性反映的是预测日天气变化的波动程度, 日前预测出力的波动程度剧烈, 说明预测日天气变化多端, 此时的风电功率预测更加有难度, 风电功率预测误差就越大。本节的波动性用第j天的日前预测出力的标准方差Sj衡量, 如式 (3) 所示。

图2给出了预测出力波动值与平均绝对误差相关性统计图。可见, 风电功率平均绝对误差的变化趋势与波动值变化基本一致, 较大的风电功率标准方差对应较大的平均绝对误差, 两者的相关性系数为r=0.559 6, 表示两者具有一定正相关性。

2.2 近期风电出力波动性对预测误差的影响分析

近期风电出力波动性反映的是近几天风电功率变化的趋势, 近期风电出力的波动性越小, 说明近几天风速变化较缓和, 天气变化情况较为平稳。据此可推测, 次日风电功率也较为平缓, 因此预测难度相对较小, 风电功率预测误差就越小。第j天前的近R天风电出力的波动性用标准方差SRj衡量, 如式 (4) 所示。

式中:N=Rn, 为近R天的数据个数。

图3给出了近期风电出力波动性与平均绝对误差相关性统计图。统计结果表明, 两者的变化趋势基本吻合, 相关性系数为r=0.549 9, 说明两者具有一定的正相关性。

2.3 风电功率幅值对风电功率预测误差的影响分析

风电出力幅值与风电功率预测误差有关。风电出力幅值较大时, 任何因素的轻微波动都会引起风电功率较大的变化, 不确定性因素较多。因此, 当风电功率预测幅值较大时, 风电功率预测较为困难, 风电功率预测误差较大。风电功率幅值用样本的平均值表示, 如式 (5) 所示。

图4给出了平均幅值与平均绝对误差相关性统计图。统计结果表明, 两者的变化曲线基本一致, 较大的风电功率平均幅值对应较大的平均绝对误差, 两者的相关性系数为r=0.754 0, 说明两者具有较强的正相关性。

2.4 风电功率预测方法对风电功率预测误差的影响分析

预测方法对风电功率预测误差的影响是指该风电场风电预测方法本身的可靠性。通过分析统计近期风电功率预测精度, 可以得到该预测软件所使用的预测方法对近期风电预测的可靠性。如果近期风电功率预测精度较高, 说明该预测软件所使用的预测方法在近期表现良好, 预测的可靠性高, 则可以推断日前预测的可靠性也较高, 从而可知日前风电功率预测误差较小。风电功率近期预测精度用第j天前近R天的平均绝对误差表示, 如式 (6) 所示。

图5给出了风电功率近期预测精度与平均绝对误差相关性统计图。两者的相关性系数为r=0.436 2, 同样具有一定的正相关性。

3 建立风电功率预测误差估计模型

目前, 风电功率预测误差估计模型主要有3种:基于历史数据统计的预测误差估计模型[4,6,9]、基于数值天气预报的预测误差估计模型[3,5]、基于多种预测软件的预测误差估计模型[8]。

基于历史数据统计的预测误差估计模型计算量大, 在线程序耗时多, 而且忽略了风电近期特征对预测误差的影响。基于数值天气预报的预测误差估计模型需要详细的数值天气预报信息。基于多种预测软件的预测误差估计模型需要系统同时具有多种风电功率预测软件。这些估计模型虽具有一定的指导意义, 但在工程实践时却有一定的难度。本文在基于历史数据统计的预测误差估计模型的基础上, 考虑风电运行的近期特征, 建立基于数据特征提取的风电功率预测误差估计模型, 并解耦为离线计算和在线计算两大模块, 程序在线计算时间短, 数据源容易获得, 工程实用性相对较好。

3.1 离线计算模块

离线计算模块用于分析风电功率历史数据, 求解权重系数, 其流程图如图6所示。

统计风电运行历史数据 (例如, 一年) , 根据式 (1) 、式 (3) 至式 (6) 计算第j天日前预测出力的平均幅值、波动系数Sj、平均绝对误差EMAE, j及SRj, EMAE, Rj。

按照风电出力相近的原则, 对该地区数据按时间段进行划分, 并计算每个时间段上的平均绝对误差EMAE, k、平均幅值、波动系数Sk及SRj和EMAE, Rj。

利用多元二项式线性回归分析建立误差估计模型, 如式 (7) 所示。

令, 代入式 (1) 及式 (3) 至式 (6) 计算出统计数据, 利用MATLAB提供的函数[b, bint, r, rint, stats]=regress (Y, X, alpha) 计算β0, β1, β2, β3, β4及其置信区间, 并对回归模型做显著性检验。其中:alpha为给定的显著性水平, 本文中均取0.05, 即置信度为95%;b为回归系数的估计值;bint为各个回归系数的置信区间估计;[r, rint, stats]对回归模型做显著性检验。检验结果表明:在置信度95%下, 回归模型显著性成立。最终建立的误差估计模型如式 (8) 所示。

已知

则EMAE, k的置信区间[EminMAE, k, EmaxMAE, k]为:

3.2 在线计算模块

在线计算模块利用离线计算所求解的系数和建立的模型, 结合近期数据, 捕捉近期特征, 利用日前预测数据估计风电功率预测误差, 如图7所示。

已知预测日近R天的运行数据, 根据式 (4) 计算第j天前近R天波动系数SRj和近R天平均绝对预测误差EMAE, Rj。根据日前预测数据, 分析其各时段出力大小和波动程度, 出力大小相近、出力波动平稳的相邻时段划分为同一时段, 由于各时间段的数据较少, 不适合用标准方差衡量波动性, 此时更适合采用斜率形式计算每一时间段的波动性。第k个时间段的波动系数和平均幅值的计算公式为:

式中:PPk, max和PPk, min分别为第k个时间段预测风电功率的最大值和最小值, 其对应的时间分别为tPk, max和tPk, min。

将所计算出的代入误差估计模型, 即式 (8) , 可得第k个时间段的估计误差EMAE, k。根据估计出的平均绝对误差, 估计风电功率实际出力的上限值PMk, max和下限值PMk, min:

式中:PPk为第k个时间段的预测风电功率。

综上所述, 根据日前预测出力估计出风电功率日前预测误差, 然后估计风电功率实际出力的上下限, 最终得到了风电功率出力估计区间。

4 算例与应用分析

4.1 算例分析

为了验证所提方法的有效性, 本文以比利时电力运营商Elia公开的2013年的风电运行数据为研究对象[22]。根据式 (1) 及式 (3) 至式 (6) 计算的值。将置信度设为95%, 然后利用函数[b, bint, r, rint, stats]=regress (Y, X, alpha) 计算式 (8) 中β0至β4的值及其对应的置信区间, 如表1所示。

根据上述离线计算的参数值, 本文估计了8月27日到8月31日连续5天的风电功率预测误差。以8月30日的风电功率日前预测误差估计为例, 其每个时间段上相应量的详细计算结果见附录A表A1。

图8给出了8月27日到8月31日连续5天的风电功率预测误差估计结果, 包括风电功率预测出力、实际出力、实际出力估计区间的上限值和下限值。从图中可以看出, 大部分风电出力的实际值都分布在估计区间内。并且, 不同时间段的日前预测出力的幅值和波动值不同, 对应的估计误差也不同, 幅值和波动性大的时间段对应较大的估计误差, 风电出力估计区间也较大。例如, 与8月29日相比, 8月31日的平均幅值较大, 波动性较剧烈, 此时的误差估计区间范围增大。

4.2 应用分析

本文所提出的风电功率预测误差估计方法同样适用于中国。为此, 以中国西北部某省的风电运行数据为例, 做了大量的算例分析以验证本方法的可行性, 图9给出了其中某天的估计结果。

由图9可知, 该省的风电功率预测误差较大, 对应的风电出力估计区间也较大。另外, 本文将所提出的方法在中国西北部某省的智能电网调度技术支持系统上开发了有关功能, 进行了初步的验证性应用。该模型在试运行的23天里, 每天有96个时间点, 对这23天的估计结果进行了统计分析, 统计结果表明:大约有85%的时间点的预测误差在该模型的估计区间内, 即本文所建立的误差估计模型包含实际误差的概率为85%左右。这与本文设定的置信度95%有所降低, 可能原因是估计模型所使用的数据源含有少量难以彻底清除的弃风、调峰等因素。该模型在中国西北部某省的智能电网调度系统的试运行界面见附录A图A1和图A2。其中, 附录A图A1给出了日前预测数据的波动系数图, 附录A图A2给出了日前预测误差的估计结果图。该应用系统根据风电功率预测误差的估计结果, 进一步确定系统的备用容量需求。在试运行期间, 所提方法的有效性得到了充分的验证。

5 结语

本文研究了基于数据特征提取的风电功率预测误差估计方法。通过大量的数据统计, 验证了影响风电功率预测误差的主要因素有:风电功率幅值、波动性、预测方法和预测周期。利用线性多元回归分析建立了风电功率预测误差估计模型, 并使用公开的风电运行数据验证了本模型的有效性, 同时还将该模型在中国西北部某省的智能调度系统中进行了示范性验证。本文所提出的风电功率预测误差估计方法既延续了风电功率历史变化规律, 又考虑了风电出力的近期表现。另外, 该方法具有在线计算强度低、数据来源可靠且容易获得的特点, 具有较高的工程实用价值。

附录见本刊网络版 (http://www.aeps-info.com/aeps/ch/index.aspx) 。

摘要:估计风电功率预测误差对电力系统的调度与控制、安全与防御等方面具有重要意义。从风电历史数据和日前预测数据特征提取的角度, 研究了日前风电功率预测误差的估计方法。首先, 提取并分析影响风电功率预测误差的主要因素, 包括风电出力波动程度、风电功率幅值、预测方法等, 并通过数据统计分析其相关性。然后, 结合风电历史运行数据, 采用多元线性回归方法建立风电功率预测误差的估计模型。最后, 基于比利时电力运营商Elia公开的风电场实际运行数据, 进行了仿真算例分析。所述方法也在中国西北部某省调度系统上应用于备用需求分析, 并实现了试运行。

上一篇:现代建筑电气节能下一篇:数字观