预测模型改进

2024-05-07

预测模型改进(精选十篇)

预测模型改进 篇1

关键词:负荷预测,灰色模型,指数加权法,欧式距离最小化,时间响应函数

0 引言

负荷预测是电力系统安全、经济和可靠运行的基础, 并且对国民经济也有重要的意义, 因此, 电力负荷预测理论与技术一直是国内外研究的重点[1,2]。目前国内外负荷预测领域中, 传统的预测方法主要有:线性回归预测算法[3]、时间序列法[4]、灰色预测法。灰色系统 (GS) 是由邓聚龙在1982年原先创立的。灰色系统理论经过20多年的发展, 目前已经成为一门新兴的边缘学科, 应用日益广泛。灰色系统理论主要解决少数据、小样本、信息不完全和经验缺乏的不确定性问题[5,6]。原始的灰色模型GM (1, 1) 模型存在许多局限性, 因此, 从灰色模型提出开始, 就有大量学者对灰色模型进行改进。牛东晓等在其文献中介绍了通过改造初始条件对灰色模型进行优化的方法:指数加权法、滑动平均法、缓冲算子处理法等, 取得良好的效果[1]。针对灰色模型的局限性, 很多学者结合智能算法对其进行了改进, 目前有与蚁群、粒子群优化、BP神经网络、支持向量机等智能仿真算法相结合的灰色预测模型, 并且广泛应用到实际负荷预测中[7,8]。基于智能算法对灰色模型的改进虽然取得了很好的效果, 但是智能算法也存在着模型复杂度高、寻优不确定等缺点。本文运用指数加权法对初始数据进行处理, 结合对初值x (1) (1) 的改进, 即利用预测值和实际值的欧氏距离最小化的方法来确定连续变化微分方程时间响应式中的参数c值来代替x (1) (1) , 通过对多个预测年用电量的预测值与真实值之间的误差的计算, 发现新模型的预测误差明显低于传统的GM (1, 1) 灰色模型, 说明新模型对原模型有明显的改进效果。另外, 改进后的新模型在算法实现方面并没有明显增加计算的复杂度, 这又从另一个方面证实了该改进方案的有效性。

1 灰色系统的基本理论与预测模型

1.1 灰色电力负荷预测概述

电力负荷预测的实质是对电力市场的需求进行预测, 它是电力系统规划的基础, 作为衡量电力系统管理现代化的重要标志。准确预测未来城市对电力的需求量和未来城市电网的供电容量, 对城市供电电源点的确定和发电规划具有重要的指导意义。灰色系统 (GS) 是由邓聚龙在1982年首先创立的。灰色系统理论经过20多年的发展, 目前已经成为一门新兴的边缘学科, 应用日益广泛。灰色系统理论主要解决少数据、小样本、信息不完全和经验缺乏的不确定性问题, 将其有用影响因素复杂、不确定性较强的电力负荷预测中有很高的理论和实际意义。

1.2 灰色建模过程

1.2.1 建立原始数列X (0)

1.2.2 建立累加生成数列X (1)

1.2.3 建立GM (1, 1) 模型的原始形式及微分方程

GM (1, 1) 模型的原始形式为:

其中a为发展系数, b为灰色作用量。

建立其一阶微分方程:

u为协调系数。

1.2.4 确定方程参数

根据最小二乘原理求参数:

1.2.5 建立时间相应函数

通过上述计算, 得到模型的时间响应函数:

1.2.6 确定原始数值

对进行累减生成计算, 得到还原值:

2 改进灰色模型电力负荷预测

2.1 GM (1, 1) 模型的局限性

GM (1, 1) 在许多领域尤其是数据缺乏和不确定性显著的状况中得到了广泛应用。但是由于GM (1, 1) 存在合理选择背景值、从微分离散方程求得参数直接带入到连续方程中的直接跳跃等模型本身存在固有的参数估计缺陷问题, 模型预测值和实际值可能会存在较大误差, 在进行实际电力负荷预测时具有以下局限性:

(1) 传统GM (1, 1) 模型对数据要求比较高, 当原始数据的离散程度较大时, 会使得模型预测的不准确。

(2) 灰色负荷预测适用于有少量历史负荷数据的系统, 当原始数据量过大时, 传统灰色模型便会表现出不适宜性。

(3) 原始灰色预测模型对中长期的预测不是特别准确, 可能出现增长率过快的情形。

(4) 传统GM (1, 1) 模型仅考虑用电负荷这一单一的因素, 而电力负荷往往会受到很多复杂因素的影响, 并且该模型也不能在未来任何时刻都能充分反映电力负荷的发展趋势。

传统GM (1, 1) 模型的局限性导致其不能满足实际电力负荷预测应用的需要, 因此需要对GM (1, 1) 模型进行改进, 改善GM (1, 1) 模型的缺陷, 从而提高其预测精度和模型实用性。

2.2 对初始条件的改进

由于电力负荷变化具有波动性, 可能受到异常值的影响, 对电力负荷原始数据序列进行处理需要强化原始数列的趋势, 消弱异常值的影响, 从而提高数据的使用效率, 得到更精确的结果。指数加权法是负荷预测方法中使用的最普遍的一种方法, 在实际中得到了较好的运用。对原始数列{x (0) (t) }按下式 (令y (0) (1) =x (0) (1) ) :

生成新的指数递增序列{y (0) (t) }, 注意要求{x (0) (t) }都为正。然后对{y (0) (t) }应用GM方法进行预测, 得预测值, 再按下式:

将序列还原成{x (0) (t) }。

2.3 对初值选择的改进

在原始灰色模型GM (1, 1) 中, 选取x (1) (1) 作为初值, 采用曲线拟合, 根据初值求解时间响应式。然后x (1) (1) 是一个最旧的历史数据, 与未来关系并不密切, 规律性较弱, 这一点使得对初值的选取进行改进成为必要。

为了改进预测模型, 提高预测精度, 利用预测值和实际值的欧氏距离最小化的方法来确定连续变化微分方程时间响应式中的参数c值, 具体表示公式如下:

在传统GM (1, 1) 模型中, 通过假使x (1) (1) =x (0) (1) , 得到

本文通过构造原始数据序列x (0) (k) 与预测值的欧氏距离构成的函数F (c) , 求解该函数最小值:

根据极值的一阶条件:令F (c) ′=0, 从而求得c值。

将所求c代入通解公式, 便得到改进初值的灰色模型。在本文中, 取x (0) (t) 为平滑处理后的数据。

3 应用及算例结果分析

笔者通过统计年鉴中1999年到2005年的用电量预测2006年到2010年的用电量。将改进后的预测结果与实际值进行比较, 求出绝对误差和相对误差, 并且与普通的误差进行比较, 用Matlab7.1编程得到以下结果, 如表1所示。

注:本文在对数据进行平滑处理时参数a的取值为0.8.

由结果可以看出, 改进后的灰色GM (1, 1) 模型比原始灰色模型的预测准确度有很大提高, 特别是对2年后数据的预测, 相对误差降低了将近一半;改进前对未来5年负荷预测的平均相对误差为6.94%, 改进后模型预测的平均相对误差为3.90%, 误差率降低了3.04%;以上数据都表明本文对原始灰色模型的改进是有意义的, 能取得比较好的效果。

4 总结与展望

随着电力改革的深入, 电网建设的滞后性已成为制约经济社会发展的瓶颈, 电网规划和电网建设成为今后电力企业工作的重心, 这也决定了电力负荷的中长期预测的重要性。电力负荷的中长期预测是电网运行的经济性、安全性和可靠性的保证。本文主要用指数平均法和对初值的改进对原始灰色GM (1, 1) 模型进行了改进, 通过用1999-2005年的我国年度电力消费量预测2006-2010年的年度电力消费量, 并且与实际值进行对比, 证明了对模型改进的有效性。

由本文中的预测结果可以看出, 在进行电力负荷年度预测是, 对前两年的预测精度是很高的, 而对三年后的数据的预测就出现了较大的相对误差, 而进行电网规划时有时需要对5年, 10年后的负荷进行预测, 因此本文的模型出现了很大的局限性, 还需要对初始序列, 初值, 以至于模型本身进行进一步的改进才能更好的对长期负荷进行预测, 对电力规划提供指导。

参考文献

[1]牛东晓.电力负荷预测技术及其应用[M].北京:中国电力出版社, 1998.

[2]牛东晓.具有二重趋势性的季节型电力负荷预测组合优化灰色神经网络模型[J].中国电机工程学报, 2002, 22 (1) :29-32.

[3]黄元生, 王玉玮.基于线性回归方法的我国电力市场短期用电需求预测分析[J].价值工程, 2011 (11) :17-18.

[4]Contreras J, Espinola R, Nogales F J, et al.ARIMA models to predict next-day electricity prices[J].IEEE Trans on Power Systems, 2003, 18 (3) :1014-1020.

[5]肖新平, 宋中民, 李峰.灰技术基础及其应用[M].科学出版社, 2005.

[6]邓聚龙.灰色系统基本方法 (第2版) [M].华中科技大学出版社, 2005:2-12.

[7]Che—Chiang Hsu, Chia-Yon CHEN.Applications of improved grey prediction model for power demand forecasting[J].Energy Conversion and management, 2003 (44) :55-57.

预测模型改进 篇2

基于改进的GM(1,1)模型的公路里程预测

分析了传统GM(1,1)模型在公路网里程预测中存在的.问题,利用残差改进了GM(1,1)模型,运用马尔可夫状态转移矩阵判断残差预测值在k≥n时的符号,提高了预测精度.对广西省公路网里程进行了预测分析,结果表明该法具有较高的实用性.

作 者:张萌 张生瑞 王超深 ZHANG Meng ZHANG Sheng-rui WANG Chao-shen  作者单位:长安大学,公路学院,陕西,西安,710064 刊 名:山东交通学院学报 英文刊名:JOURNAL OF SHANDONG JIAOTONG UNIVERSITY 年,卷(期): 17(3) 分类号:U412.1 关键词:GM(1,1)模型   灰色预测   马尔可夫状态转移矩阵   残差  

营销新时代:关于预测模型的预测 篇3

在快速消费品行业,新产品销量预测是基于一个考虑消费者和营销数据的模型。消费者数据包括采购和购物历史以及产品曝光率和评价。营销数据包括市场数据(比如,该类产品目前的渗透率、份额和定价)以及测试产品的预期营销计划(比如,广告支出和分销级别)。这些组成部分被整合成一个预测模型,以便预测新产品在投放市场后一两年内的销售情况,如所示。

预测模型自20世纪70年代问世以来一直是行之有效的,与其之前的预测(即真实的店内测试市场)相比,这些预测模型为预测新款快速消费品的销售情况提供工一个更有效、更具成本效益的手段,而且准确度不低于前者。

营销新时代

目前我们面临着营销新时代。媒介不断细分,电视和平面广告得到补充——有时被取而代之——公司网站、互联网广告、搜索引擎优化、社交媒介、移动通信、电视剧电影中的产品投放、赞助以及口碑。这些新途径为快速消费品营销人员提供了数不胜数的机会。比如,超级碗或世界杯期间一段30秒的电视广告就会耗费数百万美元之巨。不过,YouTub上的病毒式营销或许也能取得同样的效果,而且花费更少,举个例子:Stride口香糖赞助了一段由用户拍摄的名为“跳舞毯”的视频,其中,用户让他的一位朋友拍摄他与世界各地的当地人一起跳舞的情景,赢得了2000万次的YouTube访问量。

尽管在营销新时代,机会无处不在,但新挑战和威胁却开始显露出来。创新过程将注意力更多地放在初期阶段,实现突破性创新以获得更多的关注,全球化日渐成为准则。此外,竞争并不容易加以界定。新产品可能横跨多个类别,或产生一个新的类别,抑或是面临自有品牌的激烈竞争。那么,在营销新时代,预测模型将发生怎样的转变呢?

关于预测模型未来的洞察

以下是关于预测模型在接下来5年时间里演变的七种预测,以期更好地帮助包装消费品营销人员在其新产品营销过程中取得成功。

预测1:预测与金融咨询相联系

营销人员对其目前的创新度量感到不满意,觉得缺乏责任性。在波士顿咨询集团2009年进行的一项调查中,不到1,3的受访公司表示,它们对自己的创新度量感到满意。在2010年麦肯锡进行的全球调查中,仅27%的受访者表示其所在的公司在对商业领袖进行创新问责方面做得非常或极为有效。

预测模型有助于提供与营销行动准则和ROI目标有关的指导意见。此外,预测模型还可用作规划工具。预测模型可在与研发投资、工厂产能和库存管理有关的问题上为公司提供帮助。许多公司寻求的不仅仅是单一预测和置信区间,它们希望了解实现不同’目标的可能性。比如,预测结果可能是:有80%的可能性实现3000万台销量,有50%的可能性实现3500万台销量,而仅有10%的可能性达到4000万台销量。

预测2:向受访者级模型转移

如今,预测模型的一些方面具有受访者级的元素。然而,预测模型仍然是笼统的。我们并未针对每个消费者创建预测模型。拥有一个受访者预测模型,可以更好地激发媒介和分销,为针对性的创新做出更好的预测。

正如所示,我们可以通过了解每位受访者,得到一个更可行的预测模型。通过模拟与媒介计划相结合的消费者媒介习惯、与店内分销和促销计划相结合的消费者购物历史以及消费者对产品线中各个产品的兴趣,我们可以开发出针对特定时间期限内产品线中各个产品的消费者的预测模型。

预测3:对全球转移性给予更多关注

如今,公司为了控制成本,在少数市场上进行预测,而在其他市场上做出猜测。比如,对澳大利亚进行预测,对新西兰则做出最佳猜测。

理论上说,营销人员能够考量两个市场共有的特性,比如:市场份额和渗透率以及媒介和零售环境,先投资进行针对澳大利亚的预测,然后根据澳大利亚和新西兰市场的共同点,得山针对新西兰的预测。我们把根据一个市场预测另一个市场的能力称作可转移性,我们预计,还将会出现更系统、更准确的手段来将一个市场的预测模型转移至另一个市场上。

预测4:更多地关注竞争

如今,尽管竞争对于新产品的成功具有重要的影响作用,大部分预测模型仍只着重于测试产品。

竞争可以是直截了当的,比如,一个著名的制造商品牌击败投放到市场上的新产品,或自由品牌的受欢迎程度与日俱增。或者,可能很难对竞争加以界定,尤其是新产品系列的市场新军(比如,红牛能量饮料),横跨多个类别(比如,一款既是糖果又是薄荷糖的产品),或产品类别比较模糊(比如,掺有酸乳酪的强化麦片)的产品。预测模型应能够甄别竞争对手,并考虑创新在与这些竞争对手的竞争中如何发挥作用。此外,预测模型必须应对未大肆做广告的产品,利用非传统媒介,或在了解竞争对手的基础上依赖购买营销策略。

传统做法是将新产品放到其将要上市的国家的历史数据库中,和相关品类的基准进行比较。这些历史数据库通常案例太少(尤其对于新产品类别和新兴市场,更是如此),类似于暗箱操作,而关于数据库包含哪些理念,更是毫无透明度可言。

另一种手段使消费者得以界定竞争对手,然后根据能够在预测模型中加以利用的对比情况来制定基准。这种方法具有明显的优点:(1)不存在暗箱;(2)测试产品是对照其需要在市场上击败的竞争对手来予以评价的;(3)诊断与预测直接相关,这样便可以激发诊断方面的改进(参见图4)。

预测5:预测由产品推出前改变为产品推出后

鉴于有如此之多的变量能够影响创新的发展和推出过程,营销人员必须能够预测此过程中任何一个时间点的销售情况。我们预计,预测将在比目前更早的时候进行,比如,在掌握调查数据之前一当营销人员想通过确定普通产品在其目标市场上的表现,来评估某种创意的市场潜力时。此外。我们预计,在研究各个阶段进行预测将变成常态,不仅在概念筛选期间,而且也在文案、包装、定价和产品测试期间。预测在产品推出后不会停止一我们预计,预测将在产品推出后继续进行下去,以便了解新产品在出现出乎意料的事件(比如,营销计划变更、新的竞争对手或意料之外的流言)时可能选择的方向。将开发出新的模拟器和仪表盘工具,以便营销人员更容易分析新产品在所有接触点期间的进展。

预测6:更好地预测颠覆性创新

经过多年的产品线扩展(这些产品中有许多在市场上反响不佳),营销人员越来越重视颠覆陛创新一因具备明显优势或更低成本而赢得新消费者青睐的创新(比如,Dannon Aetlvla、Nestle Nespress0和Swiffer Sweeper),这些创新更难以预测。

预测颠覆性创新要求运用一种有别于典型创新中所使用的手段。这些预测需要一个独特的样本(例如,主要使用者、有影响力者和关键利益相关者)、一份更全面的调查问卷(应包括哪些人会购买和使用该产品、用于哪些场合、竞争对手情况如何以及其他未知情况)、一个比典型概念更具说明性的刺激因素(详细描述得到满足的基本需求、产品的优点、相信的理由和使用的简便性,包括图纸、示范样品或视频)。

重要的是,颠覆性创新的预测模型需要融入独具特色的方面(比如,slower trialbuild),以及强调口碑的重要性。

预测7:样本、调查和度量将发生转变

在未来5年里,预计会出现:

·新的数据采集方法,包括智能电话和笔记本电脑。

·新的采样规则,由于越来越难以找到受访者,样本库将不再可能作为唯一的解决方案,我们将求助于非样本库,并在整个互联网上进行采祥。尽管这些样本可能不具有代表性,但如果我们能证明它们符合关键基准,那么它们还是合乎要求的。

·新的度量,比如开放式问题和互联网反馈。

·旨在促进参与的交互式调查,调查将采用更多图形化界面和具有较少评定量表、广播形按钮与栅格的拖放功能,以增强参与性,提高回答问题的质量。

·新的分析方法,我们将采用新的分析方法,比如,文字挖掘和个体为本模型。

这些转变要求预测模型采用与其以往适应网络的相同的方式来加以适应。然而,这些转变的意义更加重大,因为向网络的转变主要是并行测试校准,所采用的样本、度量、调查表、格式和分析方法都相同。预测模型:变革的时刻

弱化改进后的灰色预测模型研究 篇4

1 灰色预测模型理论

1.1 GM(1,1)模型的基本理论

X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),X(1)=(x(1)(1),x(1)(2),…,x(1)(n)),则称x(0)(k)+ax(1)(k)=b为GM(1,1)模型的原始形式。

Z(1)=(z(1)(2),z(1)(3),…,z(1)(n)),其中,z(1)(k)=1/2(x(1)(k)+x(1)(k-1)),k=2,3,…,n,则称x(0)(k)+az(1)(k)=b为GM(1,1)模型的基本形式。

X(0)的非负序列:X(0)=(x(0)(1),x(0)(2),…,x(0)(n))。其中,x(0)(k)>0,k=1,2,…,n;

累加序列X(1):X(1)=(x(1)(1),x(1)(2),…,x(1)(n))。其中,x(1)(k)=i=1kx(0)(i),k=1,2,,n;

紧邻均值生成序列Z(1):Z(1)=(z(1)(2),z(1)(3),…,z(1)(n))。其中,z(1)(k)=1/2(x(1)(k)+x(1)(k-1)),k=2,3,…,n

对生成的序列构造白化方程:

dx(1)dt+ax(1)=b(1)

即得到GM(1,1)模型。其中ab均为灰色参数:

[ab]=(BΤB)-1BΤY(2)

其中,Y=[x(0)(2)x(0)(3)x(0)(n)]B=[-z(1)(2)1-z(1)(3)11-z(1)(n)1]

求出ab后代入白化方程中解出微分方程得:

x(1)(k+1)=(x(1)-ba)e-ak+bak=12n(3)

还原值:

x(0)(k+1)=x(1)(k+1)-x(1)(k)k=12n(4)

1.2 弱化改进

因本文所研究的沉降数据变化趋势呈指数形式且沉降量变化缓慢,对于传统灰色理论和优化灰色理论以及不等时灰色预测理论预测的结果与实际偏差较大,故采用以下方法弱化处理原始观测数据之后再进行预测。

设序列:

X=(x(1),x(2),…,x(n))。

一次弱化后序列:

XD=(x(1)d,x(2)d,…,x(n)d)。

其中,x(k)d=1n-k+1[x(k)+x(k+1)++x(n)],

k=1,2,…,n (5)

二次弱化后序列:

XDD=(x(1)d2,x(2)d2,…,x(n)d2)。

其中,

x(k)d2=1n-k+1[x(k)d+x(k+1)d++x(n)d]k=12n(6)

2 模型的精度检验

在建立了GM(1,1)预测模型和得到了预测值后,为了确定其可信度,必须对模型的精度进行评定,本文以预测差值、相对误差和平均相对误差作为检验标准。

差值:δ(i)=x(i)-x(i)i=12n

相对误差:ε(i)=δ(i)/x(i),i=1,2,…,n。

平均相对误差:Δ=1ni=1nε(i)i=12n

3 工程实例

3.1 工程概况

选取武广客运专线XXTJV标段中铁十九局区段实测原始数据,以DK1961+362.00(路基中点)观测沉降为例。该处所在路基段为DK1961+215.0~DK1961+426.02,该段为丘陵区,地形较缓,山头浑圆自然坡度约15°~30°,路基主要为路堑形式。主要的工程地质问题:1)谷地中分布的软土,松软土属中高压缩性土,作为路基土易产生较大沉降应进行加固处理或予以清除。2)丘坡表层灰岩残积土具有弱膨胀性,边坡防护,基床处理等应予以充分考虑。3)灰岩区基底溶洞较发育,各类工程施工应予以充分考虑。4)DK1961+362.00断面处用CFG桩进行地基处理。

3.2 观测点的埋设

路面观测桩采用ϕ20 mm钢筋,埋置坑深不小于30 cm,直径大于15 cm,观测点头为半球形,高出埋设混凝土表面5 mm,表面作好防锈处理。埋设形式如图1,图2所示。

3.3 实测数据

DK1961+362.00处沉降实测数据(见图3,表1),观测时间从2008年2月29日~2008年12月15日止。

3.4 MATLAB计算分析

沉降预测应用加载完成后的观测数据。对DK1961+362.00断面处的灰色建模分析分两种情况:1)直接用观测的数据进行预测;2)先将实际观测的数据进行弱化处理,然后对处理后的数据进行预测。

1)现用表1中B列的数据建模计算(实测数据弱化处理后),预测出13个值与C列对比,对比结果见表2。

2)现用表1中B列的数据建模计算(实测数据直接预测),预测出13个值与C列对比,对比结果见表3。

通过表2和表3的计算结果分析可以看出,弱化处理原始数据后的预测值与实测值的绝对误差非常小,平均相对误差只有2.29%,最大相对误差也只有4.67%,满足工程要求;而没有弱化处理的预测平均误差则是13.345%,已经不满足工程要求了。

3)现用表1中C列的数据建模计算(实测数据弱化处理后),预测出13个值与D列对比,对比结果见表4。

4)现用表1中C列的数据建模计算(实测数据直接预测),预测出13个值与D列对比,对比结果见表5。

通过表4和表5的计算结果分析可以看出,弱化处理原始数据后的预测值与实测值的绝对误差非常小,平均相对误差只有0.95%,最大相对误差也只有2.39%,满足要求;而没有弱化处理的预测平均误差也有2.156 3%,明显比弱化后的预测效果要差。

4结语

从计算对比分析中可以得出以下几点:1)灰色理论在沉降预测中有很好的预测效果,可以明显的减少观测次数而缩短工期。用表1中B列的数据可以预测出表1中C列的数据,然后可能预测出表1中D列的数据,也就是说,只要保证前段时间数据的准确性,就可以较好的预测出后期的且满足工程需求的沉降量。2)弱化改进处理原始数据后的预测模型可以明显的提高预测值的精度。对比表2,表3可以看出平均相对误差从13%减小到2.3%;对比表4,表5可以看出平均相对误差从2.2%减小到0.9%。3)本文所选数据,是在大量分析各桩号沉降数据中随机选取的,所得出的结论具有一般性。

摘要:以武广客运专线某路段工程实测数据为基础,先用灰色理论进行建模预测,再用弱化改进后的灰色模型进行建模预测,并分别与实测数据进行对比,结果表明,弱化改进后的灰色预测模型预测精度会有很大的提高,能够满足工程要求,从而最大限度的减少观测期数而大大的缩短工期。

关键词:沉降预测,灰色理论,GM(1,1)模型,弱化处理

参考文献

[1]刘思峰,党耀国,方志耕.灰色系统理论及其应用[M].北京:科学出版社,2004.

[2]邓聚龙.灰色预测与决策[M].武汉:华中工学院出版社,1986.

[3]邓聚龙.五种灰色预测[J].模糊数学,1985(2):33-42.

备件需求预测模型研究 篇5

备件需求预测模型研究

备件费用在整个装备全寿命周期费用中占有很大的比例,因此,合理配置备件一直是精确化保障研究的热点之一.备件需求量的预测则是制定保障计划的核心问题和关键所在,它将直接影响后续的筹措、分配、储存、调拨等各项工作的顺利进行. 由于设备系统的复杂性、零件故障的`随机性、备件消耗的特殊性,因此,备件的需求难以预测.目前备件需求量的预测主要采用以下方法.

作 者:李保华 杨云  作者单位:空军工程大学导弹学院 刊 名:航空维修与工程  PKU英文刊名:AVIATION MAINTENANCE & ENGINEERING 年,卷(期): “”(5) 分类号:V2 关键词: 

让品牌模型预测更准确 篇6

拓展市场份额是消费品营销人员的主要目标之一。鉴于消费品市场竞争越来越激烈,数字营销的演变颇为迅猛,消费者越来越精明,而且他们现在用来寻找和分享与品牌相关信息的手段和用来选择品牌的渠道也比以往多得多,所以,完成这一任务绝非易事。

要想建立市场份额,营销人员首先必须识别可在实现这一目标时加以充分利用的各种驱动因素。下一个步骤通常是根据已识别的驱动因素,利用一种模拟工具,来确定优化市场份额的最佳营销策略。在这个阶段,营销人员经常面临的挫折是许多模拟器并未反映出市场中将发生的切实变化。模拟器预测的变化往往有夸大之嫌,营销人员只能将这些结果作为指导性参考。

益普索(Ipsos)利用自己的研究结果,建立了一个藉以确定何种品牌元素在驱动消费者选择的新构架,并提出一种更为准确的方法,进行旨在优化品牌份额的市场模拟。以下是益普索(IpsoS)根据自己的品牌研究情况,针对上述各个问题开发出的解决方案。

问题1:未能捕捉消费者与品牌产生联系的所有方式

营销人员在进行品牌研究时所面临的核心挑战是,识别驱动消费者选择的品牌元素。有些研究手段着重于功能方面,而有些则着重于情感方面。还有一些手段则着重于特定方面,比如:品牌的个性。实际上,要想建立对品牌选择驱动情况的全盘理解,进而能够实施成功的营销策略,品牌框架必须聚焦所有这些方面。

解决方案:了解品牌本身的主体和灵魂

正如人类一样,一个品牌也拥有包括主体和灵魂的DNA,品牌研究也正基于此。品牌的主体和灵魂有助于将品牌与消费者的头脑和内心联系起来。这种联系是通过消费者与品牌间的各种互动形成的,进而产生一种品牌体验。

品牌的主体主要组成部分为:功能属性和品牌形象。品牌的灵魂主要组成部分为:情感需求和品牌个性。主体和灵魂的这四个组成部分组成了品牌的DNA。它们激发了品牌在消费者心目中的固有价值或优势,代表着品牌资产。

我们经过研究发现,在主体和灵魂的四个组成部分中,每个组成部分自身都能很好地说明驱动品牌资产的究竟是什么。因此,品牌框架若仅着重于四个组成部分中的一个或两个,我们不能说它们是错误的;然而,它们是不完整的。如果我们的品牌框架中只有四个组成部分中的一个,那么我们最多能预测出60%的消费者品牌选择。

我们研究得出的另一个重要结论是,功能因素和情感因素是具有内在联系的。任何一个强调功能利益的品牌定位或传播亦会影响着情感利益。

正如本文前面所讲的,主体和灵魂的四个组成部分驱动着品牌资产。品牌资产与品牌的价格一起驱动品牌价值,后者反映出品牌选择的消费者份额。根据我们的研究,我们能开发出一种包含这四个组成部分的模型,加上价格,来预测品牌价值(选择份额)。我们已证实,我们的品牌价值模型所得出的结果与实际的市场份额极为接近。

问题2:晶牌的未来方向在此模型中未予考虑

许多模型仅衡量品牌的当前优势。然而,营销人员需要了解消费者与品牌是如何连接在一起的,来预测其品牌是否有可能增大或减少市场份额。

解决方案:利用亲善度衡量品牌的关联性

通过研发,我们有能力衡量一个我们称之为“亲善度”的量度。亲善度亦称作“忠诚度”,这个量度用来衡量消费者将来持续使用某个品牌的可能性。亲善度是通过结合斟酌品牌价值和各种障碍——难以转换品牌的因素——来获得的。例如,当一位妈妈开始为自己的宝宝选择特定品牌的婴儿配方奶粉时,那么就很难让宝宝换用其他品牌的配方奶粉。这种障碍是指新配方奶粉不适合宝宝饮用的风险。亲善度已被证明是未来消费者行为的反映。

了解亲善度,有助于营销人员识别出对品牌不太忠诚的消费者(即便他们正在使用这个品牌),之后再采取措施提升其满意度。同样重要的还有,营销人员可识别出对品牌忠诚的核心消费者,对这些消费者实施各种策略,以便加强并保持他们的忠诚度。

问题3:品牌模拟器并未作出现实的预测

品牌研究的关键应用之一是以优化品牌份额为目标来模拟不同的营销策略。令人遗憾的是,目前用于估算市场份额的模拟器往往并未反映出当前市场中所发生的真实变化。造成这一失败的主要原因之一是模拟器中并未涵盖所有的品牌选择的驱动力。另外一个重要原因则是并未使用个人层面的数据。

解决方案:利用个人层面模拟模型预测份额增长

品牌的主体和灵魂的全部四个组成部分(以及它们之间的相互作用)应反映在品牌模拟器中。此外,品牌模拟器应基于个人层面的数据。为什么?因为每个消费者都是独具特色的,因而具有不同的需求。结果便是更具现实意义的模拟。

我们的研究表明,个人层面的模型在预测消费者行为方面,准确度至少高出30%。

下图是一个模拟实例,该实例包含了主体和灵魂的四个组成部分,并使用了个人层面数据。在这个例子中,模拟的是8号品牌的绩效。

模拟器生成了一幅直线图,其中红色虚线表示8号品牌在关键驱动因素上的当前绩效。红色实线表示该品牌在这些驱动因素上的改进绩效,这正是8号品牌营销人员想要模拟的。蓝线表示给定8号品牌的模拟改进绩效后4号品牌的绩效。

模拟器接着会生成一幅柱状图,其中描述了8号品牌的改进绩效对此类别中各品牌选择份额的影响。假定8号品牌在关键类别驱动力方面的模拟改进绩效后,各种品牌目前的选择份额(以绿色显示)是与模拟的选择份额(以蓝色显示)一起显示出来的。随着8号品牌绩效不断改进,选择其他竞争品牌的份额呈下降趋势。8号品牌份额的规模不断加大,其他竞争品牌的份额则不断下降,这是实际市场的真实反应。

最終解决方案:一个全新、全面的品牌框架一PERCEPTOBluS

通过研发,我们已开发出一款新型品牌研究工具PERCEPTORBlus,它能帮助营销人员应对他们在试图利用品牌研究优化策略并预测市场增长时所面临的重要挑战。

具体说来,PERCEPTOR。plus能够:

通过评估品牌的主体和灵魂,捕捉消费者与品牌的所有联系方式。

通过衡量亲善度,给出对品牌未来方向的认识。

·采用个人层面模型准确模拟市场份额。

完整的PERCEPTORPlus框架如右图所示。

令PERCEPTORPlus与众不同的是,它能够将品牌选择的所有相关驱动因素——品牌的主体和灵魂,整合成一个综合框架,可供营销人员用来测定品牌资产、品牌价值(选择份额)和亲善度(忠诚度)。营销人员亦可利用PERCEPTORPlus模拟器预测不同策略对市场份额所产生的影响。由于此模拟器涵盖了品牌的主体和灵魂,且以经过证实的单层面模拟为基础,营销人员可全副武装地投入至Ⅱ市场份额的战斗之中……并最终获胜!

预测模型改进 篇7

1 基于KNN算法的价格预测模型的一般原理

在利用多种不同属性对数值型数据进行预测时,贝叶斯分类器、决策树,以及支持向量机都不是最佳算法。价格是一种典型的数值型数据,所以在价格预测模型中,本文选择有着良好数值处理能力的k-最近邻算法(k-nearest neighbors,KNN)。

KNN算法的工作原理是:接收一个待进行数值预测的新数据项,然后将其与一组样本集中的数据项进行比较,从中找出与待预测数据项最为接近的k个数据项,并对其求均值以得到最终的预测结果。

在整个预测模型中首先从待预测商品上提取特征,将这些特征转换到向量空间,然后利用KNN算法进行预测,最后得到预测价格。如图1所示。

KNN算法分为三部分:特征提取,搜索最近邻居,产生预测结果[1,2]。

1.1 商品特征提取

进行诸如价格预测这样的数值型预测,一项关键的工作就是确定哪些商品特征是重要的,以及如何将它们组合在一起。比如,在笔记本电脑价格中,内存容量对价格的影响显然要比颜色大很多。还有一些商品的特征对价格没有影响,那么这些特征忽略不计。

本文采用向量空间模型(Vector Space Model,VSM),将商品转化为由若干个特征组成的空间形式(t1,t2,…,tk),tk就是本文上述的商品的特征信息。确定了特征之后,再将各个特征在商品上被赋予的数值填充到向量空间中。

最终一个商品dj的数学表示形式为:wj(w1j,w2j,…,wkj,…w│T│j),其中wkj表示特征tk在商品dj上的值,│T│表示特征向量的维数[3,4]。

以笔记本电脑为例,其向量空间模型如表1所示。

1.2 搜索最近邻居

当商品表示为特征向量后,两件商品之间的相似程度可以通过空间中这两个向量的几何关系来度量。

设有两个特征向量X=(x1,x2,…,x│T│)和Y=(y1,y2,…,y│T│),则其相似度采用欧几里德距离来表示[6]。如公式1所示:

1.3 产生预测结果

对待预测的特征向量与数据集中的所有特征向量,调用公式1,并将结果排序,将距离最近的结果位于前端;然后对其中的前k项结果的价格求平均值,这个值就是最终的预测价格。

2 改进的KNN算法

2.1 传统KNN算法存在的不足

传统KNN算法一个很大的不足是:在产生预测结果时,对k个最近邻进行了简单的算术平均,即各个最近邻是被同等对待的。而实际上应该是,与待预测的特征向量距离较近近的近邻比距离稍远的近邻在预测结果上有更高的贡献值。

2.2 权函数

一种补偿办法是根据距离的远近,为每个近邻赋予相应的权重,即较近的近邻比较远的近邻权重值大。将距离转换为权重的方法有很多,但是在选择转换方法时需要注意,较近的近邻因被赋予较大的权重,且随

着距离的增加,稍远的近邻的权重不能衰减的过快,还需保证权重值不能为0。

本文提出利用高斯函数将距离转换为权重,该函数在距离为0的时候所得的权重值为1,并且权重值会随着距离的增加而减少,但始终不会跌至0,如图2所示。

2.3 加权KNN算法

加权KNN算法与传统KNN算法在执行过程上大致相同,最重要的区别在于:加权KNN并不是对k个最近邻简单地求平均值,而是通过每个最近邻乘以相应权重,然后将所得到的结果累加,并除以所有权重值的和,如公式2所示。

公式(2)中P表示最终的预测结果,Si表示k个最近邻中的第i个,wi表示Si对应的权重值。

3 实验数据和实验结果

3.1 实验数据和实验结果

本文用C#在Windows XP系统下实现了基于改进KNN算法的价格预测系统,样本数据集使用自行持续收集一年,共计6大厂商生产的10多个品牌的笔记本电脑销售数据。预测对象是某厂商近期发布的但还未上市的4款笔记本电脑。当厂商的这4款笔记本上市后,将预测结果与实际的市场价进行对比分析。实验分析结果如表2所示。

表2中,准确度表示预测价格与实际市场价格的接近程度,误差率表示在一定K值下,算法把不相似商品误作为最近邻的概率

3.2 实验结果分析

由表2分析,k值的大小对预测结果的准确度影响较大。KNN中的k代表的是为了求得最终预测结果而参与运算的近邻个数。对于理想情况下的数据集,可以令k=1,即只会选择距离最近的邻居,并将其价格作为最终的预测结果。不过在现实世界里,远没有这样理想的情况,故最好多选取一些邻居。

本文就近邻个数对预测结果的影响进行了进一步的研究分析,实验结果如图3和图4所示。

由图3,图4分析,当选择过少的近邻时(k=1)时,预测的价格会存在大的跳跃;当选择过多的近邻时(k=16),预测准确度同样会下降,极大的低估了一些商品的价格。因为算法会对那些与待预测商品根本没有任何相似的商品进行比拟,计算得出预测价格。

显然,过多或过少的近邻数,都会使预测准确度下降。为了选择适当的近邻数,可以针对不同的数据集加以手工选择,或者采用一些优化措施。

4 基于改进KNN算法的价格预测模型的优缺点

主要优点在于,该预测模型是基于KNN算法的,算法精度高,性能稳定,新的数据可在任何时候被添加进来,无须重新进行训练。

主要缺点在于,KNN算法为了完成预测,每个待预测的数据项都必须和样本集中的所有数据项进行比较,从中求出最邻近的k项,故算法的计算量很大。另有一缺点正如上节所述,,K值的确定目前还没有很好的方法,一般采用先定一个初始值然后根据实验测试的结果逐步调整K值达到最优。

5 结束语

本文提出了一种改进的KNN算法,并以此建立了价格预测模型,最后分析了该模型的特点。实验表明,基于改进KNN算法的价格预测模型在合适k值的情况下,有很理想的预测效果。以后,就如何自动寻找最优k值以及考虑商品不同特征贡献值等方面还需进行重点研究。

参考文献

[1]张宁,贾自艳,史忠植.使用KNN算法的文本分类[J].计算机工程,2005,31(8):171-172.

[2]Bender W,Gruhl D,Morimoto N,et al.Technique for Data Hiding[J].IBM Systems Journal,1996,35(3/4):313-335.

[3]Iwerks GS,Samet H,Smith K.Continuous k-nearest Neighbor Queries For Continuously Moving Points With Updates[C]//Proc.of VLDB.2003.

[4]庞剑锋,卜东波,白硕.基于向量空间模型的文本自动分类系统的研究与实现[J].计算机应用研究,2001,18(9):23-26.

[5]李荣陆.文本分类及相关技术研究[D].上海:复旦大学,2005.

预测模型改进 篇8

水资源是城市发展和进行基础设施规划的重要因素,又是不可替代的重要自然资源,从某种程度上它限定和决定着城市的性质、规模、产业结构、布局形状、发展方向等[1]。随着人口的增长和经济的高速发展,我国出现许多缺水城市,水资源供需矛盾日益加剧,城市需水量预测研究已成为当前水资源规划与管理研究中的重要课题之一。正确预测水量需求对于城市的水资源规划管理及社会经济和环境的协调发展具有非常重要的意义。

邓聚龙教授[2]引入了灰色因子的概念,采用“累加”和“累减”的方法创立了灰色预测理论。该理论克服了时间序列预测存在的当时间序列变化趋势规律性差建立精确模型困难,以及未考虑未来序列变化影响因素作用的缺点。因此应用灰色预测模型进行城市需水量预测具有很大优势。

1 灰色预测模型

灰色预测根据过去及现在已知而未确知的信息建立一个从过去延伸到将来的GM模型,即灰色模型,从而确定系统在未来发展变化的趋势,通常分为灰色数列预测、年灾变预测、季节灾变预测、拓扑预测、系统综合预测等[3]。

GM(1,1)模型是灰色预测基础。它采用“累加”的方法,建立一个随时间变化趋势明显的时间序列,按照累加后序列的增长趋势可建立考虑灰色因子的预测模型。然后采用“累减”的方法进行逆运算,恢复原时间序列,得到预测结果[4,5]。

2 GM(1,1)模型预测的一般过程

GM(1,1)建模原理是将k个原始数据按顺序进行排列,然后对其进行数据处理,得到原始数据的数列[6]。其预测的一般过程为:

2.1 累加生成

已知原始数据序列:

对X(0)进行一次累加生成,得到生成序列:

其中:

2.2 建模

由X(1)构造背景值序列其中Z(1)(k)=αX(1)(k-1)+(1-α)X(1)(k),k=2,3,…n,一般取α=0.5。

假定X(1)具有近似指数变化规律,则白化方程(影子方程)为

将上式离散化,微分变差分,得到GM(1,1)灰微分方程如下:

2.3 求解参数α,u

用最小二乘法,可以解得式(3)中的参数α,u。其中α称为发展系数,其大小反映了序列X(0)的增长速度;u称为灰作用量(内生变量)。

2.4 建立预测公式

X(1)的预测公式为:

其中k=0,1,2,…,X(0)的预测公式为:

其中k=1,2,…,并且规定^X(0)(1)=X(0)(1)。

3 灰色预测公式存在的缺陷和修正方法

由于GM(1,1)预测实质上是一种外推法,是用指数曲线去拟合序列X(1),拟合方法是最小二乘法。而由最小二乘法原理,拟合曲线并不一定通过第一个数据点,将作为已知条件的理论依据并不存在,另外应考虑到X(0)(1)是一个最旧的数据,与未来关系不密切,而且不是通过累加生成得到,规律性不强,因此有必要抛弃传统的以为已知条件的解题方法,允许选用其他数据,例如以作为已知条件,从而解得新的预测公式[7,8]。所以

这里的m可以根据实际情况从1,2,…n中选择。新公式(6)可以作为原预测公式(4)的修正和拓广,因为如果取m=1,则式(6)与式(4)等同。

由此得到新的预测方法,基本过程如下:

(1)累加生成

(2)建模

(3)求解参数α,u

(4)依次分别选用m=1,2,…,n,建立预测公式,计算预测误差。

(5)通过比较,选取使预测误差最小的m值,建立最佳预测公式。

4 应用改进灰色预测模型实例分析

石河子市地处我国西北干旱区,年降雨量不足200mm,资源性缺水问题突出。由于人口的不断增长,城市化与工业化水平的不断提高,经济建设事业快速稳定地发展,驱动水资源需求不断上升。本文将以石河子市为案例进行分析。

(单位:万m3)

数据来源:石河子市水资源公报,石河子年鉴[9-11]

第一步:建立原始序列X(0)和累加生成序列X(1);

第三步:利用最小二乘法求得发展系数α=-0.034,灰作用量μ=5159.685;

第四步:分别选用m=1,2,…,n建立预测公式,其计算结果见表2。

第五步:模型检验:

从表2中可知,级比偏差为3.23%<10%,符合GM(1,1)模型建模要求,根据模型当分辨率为0.5时关联度大于0.6为满意,残差概率检验依据P叟0.95且C燮0.35时模型精度等级为一级,故建模精度最高的过第二点的模型为最优模型,模型为:

第六步:预测

5 结论

预测模型改进 篇9

近些年来,移动通信行业迅猛发展,移动互联已经成为人们沟通交流、获取信息的主要方式。随着移动网络用户数量以及网络应用种类的不断增加,移动数据网络所承载的数据量也与日俱增。据统计,2014 年1 月,户均移动互联网流量激增38. 6% ,移动互联网接入流量同比增长46. 9% ,月户均移动互联网接入流量同比增长38. 6%[1]。网络流量的激增导致各移动运营商对数据网络的运行情况、资源分配维护管理及网络规划等问题越来越重视。通过对已知的网络流量数据进行合理有效的建模及预测,可以掌握网络流量的变化趋势,有助于各移动运营商更好地进行网络管理,为用户提供更高质量的网络服务。

网络流量序列属于时间序列的一种,可以采用对时间序列的预测建模方法来对网络流量进行预测。对于平稳的网络流量时间序列,主要采用线性的时间序列模型来进行预测,例如AR、MA、ARMA模型等[2]。由于实际的网络流量多表现出非线性、多尺度等特性,传统的线性时间序列预测模型已经不再适用,而非线性预测模型如小波、支持向量机、神经网络等能较好的刻画出网络流量的非平稳特性,成为近年来的研究热点[3,4]。

由于各个单一预测模型均有各自的缺点,为了更好地刻画网络流量的特性及趋势,可采用组合预测模型来进行建模预测。如文献[5]及文献[6]中充分利用了小波多尺度的特点,将原始流量时间序列进行多层分解,再通过线性时间序列模型进行预测,取得了较好的预测效果。文献[7]中利用SVM较强的泛化能力,与小波技术进行结合,提高了预测精度,适合长期预测。文献[8]中采用小波与ARIMA及神经网络相结合的方法对数据进行预测,并取得了较好的预测效果。由于算法复杂度较高,或者计算时间较长等因素的限制,现有的流量预测模型多为离线预测,实际应用性不强。本文在小波分解技术的基础上,采用ARIMA及LSSVM预测模型相结合的方法对网络流量进行预测,结果表明该方法适合在线预测,且计算效率较高,预测效果较好,能进行长期预测。

1 网络流量时间序列预测

1. 1 小波分解与重构

近些年来,小波分析在数学领域中发展迅速,特别是对信号及图像的处理方面在电子信息领域的实际应用中,由于大多数目标信号为非稳定信号,特别适合小波分析来进行处理[9]。小波分析能够将目标序列根据不同尺度分解到不同层次,将目标序列的细节部分与近似部分分解开来,其中细节部分对应信号的高频分量,近似部分对应信号的低频分量[10],对于时间序列的预测,有很大帮助。通过Mallat算法实现的对原始时间序列a0的分解算法如下:

其中L为分解的最大层数,H为低通分解滤波器,G为高通分解滤波器,aj为低频系数,d为高频系数。该算法采用二抽取,每层分解后的时间序列长度为分解前的1 /2。由于时间序列长度的减少会使预测效果下降,可采用重构算法进行二插值重构。重构算法如下:

其中H和G分别为H和G的对偶算子,是分解过程的逆过程。

1. 2 最小二乘支持向量机

由于常规的对支持向量机的训练不支持数据逐一加入进行训练,不支持在线训练,在实际应用中有较大的局限性。最小二乘支持向量机LSSVM是由Suykens J. A. K提出的[11],它采用最小二乘线性系统代替传统的支持向量机解决模式识别问题所采用的二次规划方法,求解过程中,只需要解一组等式方程,因此计算速度加快很多。在提高模型泛化能力的同时,也解决了支持向量机局部极小点以及维数灾难等问题[12,13]。

设样本个数为l,样本维数为n,则样本可表示为( x1,y1) ,( x2,y2) ,…,( xl,yl) ,xi,yi∈ R,其线性函数为f( x) = ω·x + b ,对非线性样本数据采用最小二乘支持向量机进行函数估计时,优化问题则变为最小化[12]:

约束条件为:

定义拉格朗日形式为:

对L求 ω、b、ei、ai的偏导,并令其等于零,有:

对上式进行简化,得:

其中,y = y1,y2,…,yN; I = 1,1,…,1; α = [α1,α2,…,αN],为单位矩阵。

K( xi,xj) 为核函数,本文采用较常用的RBF核函数,求解可得最小二乘支持向量机预测函数为:

1. 3 ARIMA模型

ARIMA是一种常用的非平稳的时间序列模型[14],其全称为差分自回归滑动平均模型,是ARMA模型的一种推广。ARIMA ( p,d,q) 中,AR为自回归,p为自回归项; MA为滑动平均,q为滑动平均项; d为使时间序列平稳化所需要做的差分次数,由此可见,ARIMA模型比ARMA模型更加方便灵活[15]。

可通过自相关函数( ACF) 和偏自相关函数( PACF) 及其各自的相关图来判别一个时间序列是否符合ARMA模型并可同时确定p,q的值[16,17]。

2 基于小波和ARIMA-LSSVM的网络流量预测模型

2. 1 基于小波和ARIMA-LSSVM网络流量预测模型总体结构

基于小波及ARIMA-LSSVM的网络流量预测模型总体结构如图1 所示。首先对原始网络流量时间序列数据进行归一化,再通过小波分解并重构成高频分量及低频分量两部分,高频分量采用ARIMA模型进行预测,低频分量采用多输入多输出的LSSVM模型进行预测,两部分的预测结果进行拟合作为最终的网络流量的预测结果。

2. 2 原始数据预处理

原始数据为具有周期性的网络流量时间序列,由于变化较剧烈,为防止小范围内的数据特征被大范围的数据特征所掩盖,需要对数据进行预处理,一般将数据归一化为[- 1,1]之间。由于归一化后的时间序列数据取值范围减小,可以提高后续处理时的收敛速度,提高计算效率。归一化公式为:

其中mean( X) 为序列X的均值,var( X) 为序列X的方差。

2. 3 小波分解

本设计中对归一化后的数据采用Mallat算法进行小波分解,小波基选用常用的Haar小波。小波分解层数越多,分解后的高频和低频分量平稳性越好,但误差也会随着增加,对预测结果造成影响[4]。本文中原始信号S经1 层小波分解并重构,得到:

其中c0为低频分量,d0为高频分量。在对高频分量及低频分量分别进行后续预测等部分的处理。

2. 4 高频分量的ARIMA模型预测

原始时间序列经小波分解成高、低频两部分之后,采用ARIMA模型对高频部分进行预测。通常,ARIMA模型建立及预测过程主要分为以下几步[18]: ( 1) 根据对象序列的自相关函数和偏自相关函数等属性检验其平稳性; ( 2) 若为非平稳序列,则对该时间序列进行反复做差分化处理,直到序列平稳化,其中差分化处理次数即为d的值; ( 3) 建立合适的ARMA模型,根据表1 确定模型参数p、q的值; ( 4) 利用该模型对时间序列进行预测,预测步数为一个周期的时间序列长度。

2. 5 低频分量的LSSVM模型预测

利用LSSVM模型对周期性时间序列进行预测时,输入向量的构造方式、参数的选取对预测的精度及效率有较大影响。

( 1) 输入输出向量的构造

传统LSSVM模型对周期性时间序列预测时,输入向量由多个样本点组成,大多采用一个周期的样本值来进行单步预测,其输入向量及输出向量的形式也多为一维向量,输入向量为Xi=[xi,xx +1,xi +2,…,xi + T -1],输出向量为Yi[xi + T],其中xi代表单个样本值,T为周期值,i = 1,2,…,N; N为样本长度[19]。由于采样间隔时间短,单步预测在实际应用中有较大局限性。而多步预测大多采用迭代法来实现,即将前一步的预测结果作为真实值来构造输入向量,从而得到下一步的预测结果。若预测步数为一个周期样本的长度T,则对第T个时刻进行预测时,其输入向量中只有一个样本点为真实值,其余均为预测值,此种迭代方法累积误差较大[19]。

传统对网络流量时间序列预测的训练方法多为多输入单输出模型,本文在对网络流量时间序列进行预测时,采用多输入多输出的方式进行建模训练。对于周期为T,且具有n + 1 个周期的时间序列,预测其第n + 2 个周期的各个时间序列值,对模型进行训练时,其输入向量及输出向量构造如下:

其中X为输入向量,Y为输出向量,X和Y为二维向量,x'i为一维向量,且x'i[xi × T +1,xi × T +2,xi × T +3,…,xi × T + T -1,],xi为各个时间序列值。此种输入输出向量构造方法可同时得到一个周期的预测结果,解决了传统迭代方法中累计误差大的缺点。

( 2) 参数选取

核函数为RBF的LSSVM回归算法中,需要设定LSSVM模型的正则化参数 γ 以及核函数的参数 σ,参数选择不合理可能会造成模型的过学习或者欠学习的现象。合理选择 γ 及 σ 可以提高回归模型的学习能力,减小泛化误差,并能提高预测精度[19]。通常对参数 γ 及 σ 的选取方法主要有经验选择法、遗传算法、网格搜索法、k-flod交叉验证等方法。由于需要对网络流量进行在线预测,需要选择一种复杂度低的算法,本设计中采用网格搜索法进行正则化参数 γ 以及核函数的参数 σ 的选取。通常参数 γ 及 σ 的选取有一定的范围,根据此范围建立一个较大步数( 例如为10) 的二维网格,对每个网格的交叉点进行训练,选择训练效果最好的一组,再以此组参数值为中心,在小范围内进行较小步数( 例如为0. 5 或更小) 的网格搜索,最终找到较优的一组参数作为之后模型训练的参数值。参数选取的原则是使预测精度达到最大,通常选用平均相对误差( MRE) 、均方根误差( RMSE) 等作为精度的评价标准。

2. 6 预测结果拟合

小波分解后,序列的高频信息通过ARIMA模型进行预测,得到预测结果的高频分量YH= [y0,y1,…,yT -1],而低频信息通过LSSVM模型进行预测,得到预测结果的低频分量YL=[y'0,y'1,…,y'T -1],其中T为预测结果的序列长度。通过将YH与YL相加,再经过反归一化后得到最终的预测结果。

3 仿真实验与结果分析

3. 1 数据来源

实验数据来源于中国移动某市分公司,采集了该市某地区从2013 年11 月13 日到2014 年3 月18 日的共125 天的无线网络流量数据值,采集间隔为20 分钟,即共有9000 个样本点,组成网络流量的时间序列{ x( t) ,t = 1,2,…,9000} 。为了验证模型的长期有效性,通过本文的预测模型预测最后9 天的网络流量值,即通过第1 ~ N天的流量数据预测第N + 1 天的流量数据,其中N = 116,117,…,124。原始网络流量数据如图2 所示。

3. 2 数据预测及预警

本文仿真平台为matlab2012b。由于要应用到实际项目中,所以对预测性能的评价要相对全面,主要包括预测的平均相对误差( MRE) 及预测时间等评价指标。

其中y'i为网络流量的预测值,yi为网络流量的实际值,n为预测长度。预测时间是指从预测开始到预测结束所用的时间。以上两个指标越小,表明预测效果越好。

流量预测的最终目的是对流量进行预警。实际应用中,动态预警门限比静态预警门限更灵活,更能适应流量的动态变化规律。本文中流量预警采用两级动态预警门限,即一般预警门限及严重预警门限,其中一般预警门限范围为[u - 2δ,u + 2δ],严重预警门限范围为[u - 3δ,u + 3δ]。其中u为网络流量某时间点的预测值,δ 为该时间点的所有历史数据的均方差[20]。

原始流量序列经过小波分解并重构成高、低频两部分分量图分别如图3,图4 所示。其中,通过求取及分析高频分量的自相关及偏相关函数,如图5 所示,表明高频分量具有非平稳特性,可以采用ARIMA模型进行预测。

9 天的预测结果图如图6 所示,其中横坐标代表时间( 20 min) ,纵坐标代表流量( KB) 。在流量预测结果的基础上,给出了流量预警的一般预警门限及严重预警门限。

为了比较本设计模型的预测效果,我们采用如下几种方案做对比:

1) 单独采用ARIMA模型进行预测。

2) 单独采用多输入多输出的LSSVM模型进行预测。

利用以上两种对比方案预测9 天的网络流量数据,得到的结果与本文所设计的预测模型进行对比,如表2 所示。其中MRE代表预测的每个周期的平均相对误差,Time代表每次预测所需时长,单位为秒。

从表2 中可知,相对于两种对比模型,本文方法预测误差有所减小,但预测建模时间较长。经分析,主要是由于ARIMA模型建模时间较长所致。在对中国移动某市分公司网络流量进行预测的实际应用中,更注重预测精度,且此方法的预测时间在可接受范围内。若在其他应用中,可根据具体需求选择合适的建模预测方法。

4 结语

预测模型改进 篇10

饱和负荷是近年来随着电力工业的不断发展, 逐渐从电网规划中提出的新概念, 已经成为确定电网规划规模的重要指标[1,2]。根据发达国家电力工业发展轨迹, 一个地区的负荷发展由三个阶段组成:缓慢增长阶段、快速增长阶段和饱和增长阶段, 总体呈现“S”型[2]。饱和负荷的研究对象一般是区域或者省市级的负荷, 主要涉及全社会用电量、年最大负荷两个电力需求指标。

目前对饱和负荷的研究还处于起步阶段, 研究结果大多集中于小区域如城市一级范围, 对于大区域的省、国家范围的研究还非常欠缺[3,4]。研究方法也局限在人均饱和用电量法[5]、饱和负荷密度法[6]、系统动力学及计量经济学模型[7]、经济曲线饱和态势[8]及智能预测方法[9]上。灰色系统理论是研究解决灰色系统分析、建模、预测、决策和控制的理论, 灰色Verhulst模型主要用于具有饱和状态的数据预测, 具有所需建模信息少、运算方便、建模的精度较高的特点[10]。本文利用灰色Verhulst模型实现浙江地区饱和负荷时间和规模的预测, 对浙江地区经济发展和电力布局具有指导意义。

1 灰色Verhulst预测原理及模型

灰色系统是指部分信息未知, 部分信息已知的系统, 是介于黑色系统 (信息完全未知) 与白色系统 (信息完全已知) 之间的一种系统。适用于系统数据被噪声污染后出现离乱情况, 离乱的数据可以看成是灰色系统, 对灰色系统建立模型的过程称为灰色模型[10]。

灰色Verhulst模型主要用于具有饱和状态的数据预测, 与灰色GM (1, 1) 模型相比, 具有能利用新数据修正残差, 预测精度高的特点。

1.1 模型设定有非负原始数据序列:

对X0进行一阶累加得到新生成的序列为:

其中:Z1为X1的紧邻均值生成序列:

其中:z1 (k) =0.5x1 (k) +0.5x1 (k+1) , k=1, 2, …, n-1

可以得到满足灰色建模三条件的GM (1, 1) 非线性模型:x0 (k) +az1 (t) =b (z1 (k) ) α

其中a为发展系数, b为灰作用量。

其白化方程为

其中t是时间。

当α=2时, 称x0 (k) +az1 (k) =b (z1 (k) ) 2

为灰色Verhulst模型。

为灰色Verhulst模型的白化方程。

传统灰色Verhulst模型的时间响应为:

1.2 模型参数估计及改进

灰色Verhulst模型的参数最小二乘估计为:

对预测结果做一阶累减还原, 得到输入序列X0的灰色Verhulst预测模型为:

传统灰色Verhulst模型适用于非负的单峰原始数据序列, 对于时间跨度较短或者时间长度确定的预测对象, 饱和分析能够得到较好的精度。对于时间跨度长而且不确定的饱和负荷预测, 就必须对灰色Verhulst模型进行改进, 提高适应性。改进方法包括新信息循环递补和残差修正。

循环信息递补就是保证样本序列的维数不变, 每预测一个新值 (或有了实际数据) 就把改值加入样本序列, 而去掉最早的一个样本。这样使得新序列始终具有最新的数据信息, 使用新的样本序列重新输入到灰色Verhulst模型, 直到得到需要预测年份的数据为止。

残差修正是指将以样本数据的增长率为输入, 得到样本增长率的预测数据序列, 还原得到样本的预测数据序列, 与样本观测序列做差求取样本数据和预测数据的残差序列:e={e (1) , e (2) , …, e (n) }

以残差序列e作为灰色Verhulst模型的输入, 建立灰色Verhulst残差修正模型, 计算残差序列的预测值来补偿预测误差。则改进灰色Verhulst模型的预测数据序列为:

2 浙江地区经济现状与饱和负荷预测

采用灰色Verhulst模型, 以浙江地区全社会用电量和年最大负荷历史数据为样本, 进行模型参数识别, 采用Matlab软件编程实现。由于最新数据对灰色模型预测影响最大, 所以取浙江地区最近15年数据作为预测基础进行建模。

2.1 预测模型及参数估计

取X0为浙江地区全社会用电量历年增量数据, X1为浙江地区全社会用电量历年实际用电量数据, 建立灰色Verhulst模型进行饱和负荷预测并对模型精度进行分析。

得到浙江地区全社会用电量灰色Verhulst模型参数的最小二乘估计为:

实际全社会用电量与模型全社会用电量预测如表1所示。

把浙江地区实际全社会用电量与模型预测值绘制成图形, 如图1所示。

从表1中可以看出, 按照<2%进入饱和阶段标准, 全社会用电量进入饱和阶段的年份为2020年, 饱和规模为4281.28亿千瓦时。

以浙江地区年最大负荷为历史数据进行模型参数识别, 得到以年最大负荷灰色Verhulst模型参数的最小二乘估计为:

浙江地区年最大负荷与模型年最大负荷预测量如表2所示。

把浙江地区实际年最大负荷与模型预测值绘制成图形, 如图2所示。

从表2中可以看出, 按照<2%进入饱和阶段标准, 年最大负荷进入饱和阶段的年份为2020年, 饱和规模为7528.78万千瓦。

2.2 模型检验

模型精度决定预测结果是否准确由。灰色系统理论模型的模型精度检验方法有三种:残差检验法、后验差检验法和关联度检验法。

残差检验法:取样本序列X0与预测序列之差为残差序列:e={e (k) , k=1, 2, …n}

全社会用电量的相对误差见表1, 一般要求ε (k) 不大于10%, 从表1中可以看出, 全社会用电量、年最大负荷绝大多数ε (k) 都在10%以下, 说明模型具有很好的精度。

为原点误差, 一般原点误差越小越好, 全社会用电量原点误差为0.48%, 年最大负荷原点误差为1.92%, 称

为灰色模型的平均相对误差, 全社会用电量的平均相对误差为1.91%, 年最大负荷平均相对误差ε軈为4.83%。

为灰色模型的模型精度。全社会用电量的模型精度为p0=98.9%, 年最大负荷的模型精度为p0=95.17%, 说明灰色模型具有很好的模型精度。

后验差检验法:取初始数据序列X0及残差序列e的方差分别为S12和S22,

计算后验差比值及小误差概率

全社会用电量S12=842248.8, S22=2197.96。可得到S1=917.74, S2=46.88。

年最大负荷S12=2584722, S22=9100.89。可得到S1=1607.71, S2=95.40。

模型的精度由C和P共同描述, 根据P和C取值的大小, 模型精度分为“好、合格、勉强、不合格”四类, 各类的P、C值见表3。

模型精度级别为=max (P, C) 。得到全社会用电量灰色模型的模型精度级别为1级, 年最大负荷灰色模型的精度级别为1级。

关联度检验法:用关联度描述模型预测效果, 关联度ξ可以用下式计算:

一般要求ξ>0.6, 关联度越大, 表明模型预测效果越好。

得到全社会用电量灰色模型的关联度ξ=0.66>0.6, 说明全社会用电量灰色模型预测精度达到要求。年最大负荷的灰色模型的关联度ξ=0.62>0.6, 说明年最大负荷模型精度预测达到要求。

3 结论

浙江地区作为我国经济较为发达的地区, 对饱和负荷进行科学的预测分析, 可为该地区电网规划的长远发展提供可靠的参考依据, 从而避免电网规划的盲目性和随意性, 降低工程建设费用, 减少资源浪费等。对其进行科学合理的研究具有非常重要的意义。

灰色Verhulst模型具有对部分信息未知系统进行分析预测的优点, 模型可靠性高, 其特点是最新数据对预测结果影响极大。根据判定条件“预测值持续年增长率小于2%”, 预测结果表明, 浙江地区全社会用电量达到饱和的时间为2020年, 饱和规模为4281.28亿千瓦时, 年最大负荷进入饱和阶段的年份为2020年, 饱和规模为7528.78万千瓦。通过残差检验法、后验差检验法和关联度检验法分析可知, 该模型具有很高的模型精度, 能够满足预测要求。

参考文献

[1]崔凯, 李敬如, 赵彪, 等.城市饱和负荷及其预测方法研究[J].电力技术经济, 2008, 20 (6) :34-38.

[2]程浩忠, 等.电力系统规划[M].北京:中国电力出版社, 2008.

[3]崔凯, 李敬如, 刘海渡, 等.城市饱和负荷阶段电力规划方法及其在济南电网中的应用[J].电网技术, 2007, 31 (52) :14-17.

[4]崔凯, 张丽娟, 李敬如, 等.天津市中心城区饱和负荷分析与预测[J].电力技术经济, 2008, 20 (5) :33-36.

[5]王伟, 房婷婷.人均用电量法在区域饱和负荷预测中的应用研究[J].POWERDSM, 2012, 20 (6) :34-38.

[6]江新琴, 李喜兰.基于空间饱和负荷密度的城市远景饱和负荷预测[J].福州大学学报 (自然科学版) , 2008, 36 (4) :532-536.

[7]何永秀, 吴良器, 戴爱英, 等.基于系统动力学与计量经济模型的城市饱和负荷综合预测方法[J].POWER DSM, 2010, 13 (1) :21-25.

[8]王芳东, 林韩, 李传栋, 等.基于经济曲线饱和态势分析的饱和负荷宏观预测研究[J].华东电力, 2010, 38 (10) :1486-1491.

[9]王晶, 冯显时, 郭红珍.基于蚁群元胞自动机理论的城市饱和负荷预测[J].中国电力, 2011, 44 (7) :17-20.

上一篇:贫血鉴别诊断下一篇:肿瘤相关物质