交通流预测研究

2024-05-10

交通流预测研究(精选十篇)

交通流预测研究 篇1

在短期交通流预测领域的研究中, 目前已开发出多种预测模型和方法, 如利用历史平均法、线性回归法、时间序列法、卡尔曼滤波法、谱分析、神经网络、小波分析、灰色理论、非参数回归、支持向量机等来预测交通流信息。而短时交通流量预测的最大特点为具有高度的不确定性。要设计精度较高的预测方法, 各模型的互补联合将会得到更广泛的研究与应用。组合预测即是将不同的预测方法进行适当的组合, 综合利用各单项预测方法所提供的有用信息, 是提高预测精度的有效途径。相对于传统的单项模型, 组合预测更强调来源于不同模型的各种预测, 而非构造复杂的单项预测模型。组合预测模型根据权系数确定与否又可以分为定权重组合预测模型 (认为权重系数是定值) 和变权重组合预测模型 (认为权重系数是一个随时间变化的函数) 。近年来定权重组合模型得到了广泛研究, 出现了Lagrange乘数法, 梯度法等经典算法。但是由于预测环境的变化, 定权重组合预测模型可能会不适应变化, 从而影响预测精度;变权重组合预测的研究目前还比较少, 确定的方法仍处于探索阶段, 但由于变权重对时间变化敏感, 能有效地弥补定权重在这方面的缺陷, 从而提高了预测的精度。本文旨在将定权重和变权重组合模型用于预测短时交通流量, 用于实时的交通管理与控制, 为城市的智能交通工程的建设和城市规划提供依据和指导。基于此, 利用合肥市某交叉路口进口道的实际交通流量数据, 通过比较单一的时间序列模型、非参数回归法模型、RBF神经网络模型和由这三者组成的组合预测模型的预测精度, 验证交通流组合预测模型在短时交通流预测的优越性。

2 短时交通流单项预测模型

2.1 时间序列预测模型

时间序列模型是描述时间序列统计特性的一种常用方法, 它是参数化模型处理动态随机数据的一种实用方法。时间序列法运用过去时间序列的数据进行统计分析, 同时为了消除随机波动的影响, 采用加权滑动预测法进行预测, 加权滑动预测法认为各个时期的历史数据对预测值的影响不同, 距预测期较近的数据, 对预测值的影响也较大, 因而, 其权值也较大, 反之, 距离越远, 影响也越小。计算公式:

其中, 权值的选取需要反复试算, 才能得到最优的权值系数。

2.2 非参数回归法预测模型

由于预测时段较短, 交通序列呈现较大随机性, 文献[4]提出, 非参数回归模型不需要先验知识, 只需足够的历史数据, 它寻找历史数据中与当前点相似的“近邻”, 并用这些“近邻”预测下一个时段的流量。非参数回归算法认为系统所有因素之间的内在联系都蕴涵在历史数据中, 因此, 直接从历史数据中得到信息而不是为历史数据建立一个近似模型。非参数回归的函数形式是不确定的。参数回归的优点是回归结果可以外延, 缺点是回归形式一旦固定就比较呆板, 往往拟合效果较差;非参数回归结果外延困难, 但拟合效果比较好。非参数回归的回归函数Y=g (X) 的估计gn (X) 表示为

式中, Y是一维观测随机向量;X是m维随机自变量; (Xi, Yi) 是第i次观测值;Wi (Xi) 是权函数。非参数回归就是对函数的形状不加任何限制, 即对g (X) 一无所知, 要利用观测值 (Xi, Yi) , i=1, 2, …, n, 用指定的X值, 去估计Y值。非参数回归主要是涉及如何选取权函数, 权函数具体有四种主要形式:核函数、最近邻函数、样条函数、小波函数, 用的较多的是核函数法和最近邻函数法。选择权函数为最近邻函数法, 首先选取n个常数w1, w2, …, wn, 且, 在Rn空间中引入适当距离ρ, 根据按这个距离将X1, X2, …, Xn与X接近的程度重新排序, 即与X最接近的权重最大, 次近的有次大的权, 以此类推。

2.3 RBF神经网络预测模型

目前用于预测的较成熟的人工神经网络主要有BP和RBF两种神经网络。两者都是前馈型网络, 而BP神经网络具有训练时间长, 容易陷入局部最小或者振荡等缺点, RBF神经网络的训练时间却比BP神经网络少很多。RBF神经网络隐层通常选用高斯函数为激活函数, 不需要定义隐层单元数, 网络将根据训练数据自动调整隐层结构, 其中扩展常数C需要反复的试算, 才能得到最优的预测结果。RBF神经网络模型结构如图1所示。网络的输入q (i) 定义为交通流序列, 网络的输出为需要预测的交通流序列。为了便于计算, 对原始数据必须进行归一化处理。归一化公式采用:

通过上式的处理后, 样本数据将映射到[0, 1]区间内。在网络训练后用于预测时须将预测数据处理还原至原空间中。

3 组合预测模型

假设对于同一预测问题, 有n (≥2) 种预测方法。记yt为第t时刻的实际观测值, t=1, 2, …, N, fit为第i种方法在第t时刻的预测值, i=1, 2, …, n;为第t时刻的组合预测值, ki为第i种方法的权系数, 且满足。则组合模型表示为:

设第i种预测方法在第t时刻的预测误差为eit, 则。记第i种预测方法的预测误差向量为eit=[ei1ei2…ei N]T。进一步设组合预测在第t时刻的预测误差为et, 则

若记组合预测的预测误差平方和为J, 则

3.1 定权重组合预测模型

定权重组合预测法是指将几种预测模型各自的预测结果通过选取适当的权重进行加权平均得到最终预测结果的一种预测方法, 文献提出了最优组合预测方法, 这种方法是根据“预测误差平方和最小”这一原则来求取各个单项预测方法的权系数向量的。如果某一加权系数向量Kn使组合预测方法的预测误差平方和J达到极小值Jm, 则称Kn为最优加权系数向量, 其所对应的组合预测方法为最优组合预测方法。因此, 线性最优组合预测即为下列最优化问题:

(Eij) n×n;i, j=1, 2, …, n。当i≠j时, Eij表示第i种预测方法和第j种预测方法的预测误差的平方和。Eii为第i种预测方法的预测误差平方和。E (n) 为n×n方阵, 为组合预测误差信息矩阵, 且

令Rn=[1, 1…, 1]T为元素全为1的n维向量, 则加权系数的约束条件可以改写为

那么上式用矩阵表示为:

假设n种预测方法的预测误差向量e1, e2, …, en是与线性无关的, 则E (n) 为正定矩阵, 且是可逆的。显然上式的解为求条件极值的问题。根据Lagrange乘数法求条件极值问题, 可以推得

且可得预测误差的精确公式为:

由上可见, Jm与组合权重K无关, 说明最小均方误差是不依赖组合权重的。

3.2 变权重组合预测模型

变权重组合预测模型的权重的求取, 是以使样本点处组合预测误差绝对值最小为原则, 在满足权重系数本身要求的基础上, 得出优化组合模型。

对于上述模型的求解分两种情况进行。

(1) 第t时刻, 对于所有的i, 均有所有的eit≥0, (或eit≤0) , 即t时刻所有的预测模型的误差是同向的。假设在t时刻, 第i种模型预测误差最小, 则模型的解为

(2) 第t时刻, 对于预测模型的误差, 部分i有eit≥0, 对于另一部分i, 则存在eit≤0, 即t时刻对于所有预测模型的误差不是完全同向的, 假设在t时刻所有误差为非负的模型中, 第p1种模型预测误差的绝对值最小, 所有误差为负的模型中, 第p2种模型预测误差的绝对值最小。此种情况下, 则模型的解为

构建变权重组合预测模型的目的是为了预测。在确定t时刻t=g+1, g+2, …, g+j处的权重值时, 可以在式 (13) 和式 (14) 得出的数据的基础上, 对权重数据按照式 (15) 进行处理, 进而得出相应时刻各组合模型的权重系数。

4 仿真实例分析

4.1 单项模型预测

利用合肥市某路口间隔2分钟连续检测3小时的交通流量数据共90组, 采用上述时间序列法, 非参数回归法, RBF神经网络法这三种方法分别进行预测。时间序列模型利用前六个时段的历史交通量预测下一时段的交通量。选取数据的最后25组进行校验分析。非参数回归法同样选取前六个时段的历史交通量预测下一时段的交通量, 选取数据的最后25组进行预测校验分析。RBF神经网络法利用Matlab7.0软件进行预测, 网络的输入为当前及前五个时刻的交通量x (t) , x (t-1) , x (t-2) , x (t-3) , x (t-4) , x (t-5) 一组数列, 网络输出为下一时刻的交通流量x (t+1) , RBF神经网络的训练样本选取了前60组, 后面25组数据用于网络的校验分析。预测结果见图2所示。

4.2 组合权系数的计算

定权重组合预测模型的通过Matlab7.0来求解最优权重向量。根据前面的单项预测结果得到预测误差信息矩阵E (3) 。

由此, 得出参与组合预测的时间序列、非参数回归、RBF神经网络各单项预测方法的权系数为:k1=0.3688, k2=0.2016, k3=0.4296, 得出组合预测模型为:

式中:——时间序列法预测值;

——非参数回归法预测值;

——RBF神经网络法预测值。

变权重组合预测模型的权系数根据式 (13) 和式 (14) 确定。

4.3 组合预测模型性能评价

评价和比较仿真实验结果, 研究使用如下几个性能指标。

平均相对误差:

平均绝对相对误差:

最大绝对相对误差:

相对误差百分比:

均方根误差:

根据计算, 各单项预测模型及组合模型相对误差百分比见图3。各个单项预测和组合预测模型的均方根误差如表2所示。各单项预测模型及组合预测值与实际观测值对比如图4所示。

表1和表2显示了应用组合预测模型对短期交通流量进行预测, 预测误差相比任何单项预测模型最小, 变权重模型相对定权重组合模型预测精度要高很多。从图3和图4中可以看出组合模型较单项模型预测结果具有很好的稳定性, 几乎没有跳跃点。图2和图4中体现了随着信号周期的影响, 交叉口进口道处的交通流具有明显的周期波动性。

5 结论

(1) 针对交通流短时序列提出利用时间序列法, 非参数回归法和RBF神经网络预测法分别预测交通流量, 经过定权重和变权重组合预测模型进行仿真和详细的对比分析, 验证了组合预测模型相对单项模型的优越性, 变权重预测模型相对于定权重预测模型的优越性。

(2) 短时交通流状态具有复杂, 时变性, 尤其是信号交叉口信号周期的影响, 交叉口进口道处的交通流也就具有时变性和周期性, 这在图2和图4中可以明显的看出。

(3) 由于交通流的周期潮汐性和受众多不确定因素的影响, 且城市交通具有明显的时段性, 具有早中晚三个高峰期, 所以预测模型用于全时段的预测就不一定很可靠, 为此应该考虑分时段预测, 这也是本文的不足之处。

参考文献

[1]刘静, 关伟.交通流预测方法综述[J].公路交通科技, 2004, 21 (3) :82-85.

[2]郭敏, 肖翔, 蓝金辉.道路交通流短时预测方法综述[J].自动化技术与应用, 2009, 28 (6) :8-9.

[3]高慧, 赵建玉, 贾磊.短时交通流预测方法综述析[J].济南大学学报 (自然科学版) , 2008, 22 (1) :88-93.

[4]李振龙, 张利国, 钱海峰.基于非参数回归的短时交通流预测研究综述[J].交通运输工程与信息学报, 2008, 6 (4) :34-38.

[5]刘国林, 高放, 李俊芬.最优组合预测及其在短时交通流预测中的应用[J].山东科技大学学报 (自然科学版) , 2009, 28 (1) :10-12.

项目后评价中交通量分析与预测研究 篇2

项目后评价中交通量分析与预测研究

道路建设项目后评价工作中的交通量分析与预测关系到项目投资决策,而影响交通量预测的因素众多,本文从城市道路交通量预测的`方法步骤出发,寻找现行城市道路建设项目后评价工作中交通量预测方法存在的一些问题,对城市道路建设项目后评价中交通量分析和预测的准确性提供理论支持.

作 者:陈颖 作者单位:山东交通学院交通与物流工程系刊 名:科技信息英文刊名:SCIENCE & TECHNOLOGY INFORMATION年,卷(期):“”(14)分类号:U4关键词:城市道路 后评价 交通量 预测

交通流预测研究 篇3

关键词:“交通—经济”大系统;交通投资;BP神经网络;预测

作为一种人类社会发展的先行资本,交通基础设施的投资与建设成为了实现经济增长的重要先决条件。由于建设周期长、投资大,造成影响交通投资的因素十分广泛而复杂,因此在研究交通投资预测时,国内许多学者增加了影响交通投资的相关因素。匡敏、胡思继等人选取了铁路市场份额、铁路货运量、港口货物吞吐量、基本建设投资、GDP、第二产业比重、原煤产量、钢产量8个指标作为铁路运输的影响因素,运用BP神经网络对铁路运输进行了预测。方庚明运用多元回归方法,建立了包括经济、人口、政策影响客运量发展相关因素在内的客运量发展预测模型。温爱华、李松选取了GDP、公路运营里程、公路货运量、铁路运营里程、铁路复线比例、铁路货物周转量、铁路货运量、铁路运输从业人员8个指标作为影响铁路货运量的因素,基于GRNN模型对其进行了预测。王文莉、杨俊红采用灰色理论对影响铁路客运量的因素,即GDP、人口、居民平均消费水平、工业增加值、社会消费品零售总额、公路客运量、民航客运量、旅客列车旅行速度进行分析,采用动态分辨系数的灰色关联分析法实现影响因素的优化选择。

关于交通方面的预测方法较多,常用的有回归分析法、时间序列法、灰色模型预测法等,他们都需要建立函数模型才能实现预测。而且通过这些方法所建立的模型,不能全面地反映所预测动态数据内在结构的复杂性和非线性,容易丢失信息。近年来,随着神经网络技术的发展,部分学者尝试利用神经网络进行交通量的预测,构建了多种模型,并取得了一定成就。与传统的预测模型相比,神经网络模型不需要建立函数模型,有较强的自适应性和学习性,具有建立分段非线性模型的能力,对于交通基础设施这个复杂的系统来说,运用神经网络模型进行预测是一种有效的方法。

由于交通投资是一个复杂的系统工程,影响投资的因素较多,而且每个因素也会随着环境的变化而变化,因此为了全面、科学、本质地反映交通投资的变化,本文在前人研究的基础上,构建在“交通—经济”大系统环境下影响交通投资的层次结构模型,运用BP神经网络模型进行预测。

一、 交通基础设施投资影响因素层次结构模型

交通基础设施投资规模是由交通基础设施可供量和需求量共同决定的,而影响交通投资规模的可供量和需求量又涉及到社会生产与生活的方方面面,由此决定了交通投资预测是一个复杂的非线性系统。本文将影响交通投资的因素分成三大类:一类是交通基础设施自身内部的因素,主要包括交通供给与需求;第二类是经济社会因素,如GDP、产业结构状况、人均消费、人口等;第三类是经济体系的外部因素,如资源、环境、地理条件等。根据层次分析法指标体系建立的方法,将交通基础设施投资作为目标层,交通基础设施供给系统、需求系统、经济社会系统和资源系统作为准则层,影响因素作为指标层,构建在“交通—经济”大系统环境下交通基础设施投资影响因素层次结构模型(见图1)。

二、 建立交通基础设施投资的BP神经网络预测模型

1. BP神经网络的基本结构。BP神经网络是一种多层前馈神经网路,其采用误差反向传播学习算法。它由输入层、隐含层和输出层构成,通过有指导的学习方式进行训练和学习,将神经元的激活值从输入层经各个隐含层向输出层传播,在输出层的各个神经元获得网络的实际输出响应。通过比较输出层各个神经元的实际输出与期望输出,获得二者之间的误差,然后按照减少误差的方向,从输出层经过各个隐含层并逐层修正各个连接权值,最后回到输入层。这种过程不断重复进行,直到误差降低,至可以接受的范围,学习训练过程也就随之结束。通常情况下,由于训练样本有限,一般强调选择能达到要求的最小网络。因此,本文所构建的交通投资BP神经网络预测模型的其网络拓扑结构见图2所示。

2. 建立预测模型。训练对于神经网络模型的建立是至关重要的,训练结果的好坏将会影响神经网络模型的拟合与预测效果。因此,我们在训练时要考虑到预测,而不是一味地追求高拟合度,要注意整个模型拟合与预测的一致性。

基于这个目的,本文以同一年份的交通投资总额、铁路投资额、公路投资额、水运投资额、航空投资额、管道投资额、客运量、客运周转量、货运量、货运周转量、GDP、其他基础设施投资、非基础设施投资、人均消费、人口、能源消耗总量16个指标作为一个神经元。利用1980年~2009年的数据作为输入量,2010年的数据作为输出量进行网络训练;同时利用1979年~2008年的数据作为输入,2009年的数据作为输出对网络的性能进行测试,验证模型是否可靠。由于隐含层神经元的确定是根据问题的要求和输入、输出单元的多少,本文经过反复测试,确定隐含层节点数设为5比较合理。因此,本文的预测模型网络结构采用30-5-1结构,即输入层有30个神经元,隐含层有5个神经元,输出层有1个神经元,也是说用前30年数据作为学习样本,后1年的数据作为预测效果检验样本。

三、 应用BP神经网络进行交通基础设施投资的预测

1. 样本数据处理与归一化。为了提高网络训练的学习效率和收敛速度,在数据进入神经网络进行训练和检验样本之前,本文对所选取的16个指标的数据进行归一化处理。本文采用min-max规范化方法,将数据处理为区间〔0, 1〕之间的数据。由于数据量庞大,采用MATLAB7.0实现归一化处理。

2. BP神经网络训练设计。本文设定BP神经网络的各训练参数为:最大训练步数为10 000步,网络训练后达到的目标精度控制参数为0.001,学习率为0.01,将样本模式计算器和训练次数计算器都置为1,误差E置为0。采用MATLAB7.0神经网络工具箱的函数trainbpx()来完成整个模型建立与仿真。

3. 网络训练与结果分析。为了缩短学习时间,本文利用LM数值优化法来实现反传算法,网络经过2918步训练后达到设定的均方误差值0.001,训练效果良好。根据上述算法和步骤,训练好的BP神经网络的回测结果表1。

从表1中可以看出,2009年交通基础设施投资相关指标回测结果相对误差在1%~6%之间浮动,虽然有些指标有点偏大,但是总体来说结果还是令人满意的。由此,利用网络结构30-5-1的结构,逐年迭代下去,预测2011年~2020年交通基础投资的相关数据。

总体上来看,2011年到2020年我国的经济增长呈快速上升趋势,年均增长率为12.34%,而交通基础设施投资年均增长率为6.53%。与1978年~2010年经济增长与交通投资年均增长率相比,经济增长增加了2.7个百分点,而交通基础设施投资减少了8.47个百分点,说明未来10年我国的经济增长将改变原有的靠投资拉动的粗放型经济增长方式,国家将加强对交通投资的宏观调控。另外,交通投资的波动较小,缓慢上升,说明交通基础设施仍然是国家投资的重点(见图3所示)。

从交通各种运输方式的投资来看,都随着经济的增长呈现上升趋势,铁路、公路、水运、航空、管道年均增长率为4.96%、5.74%、6.79%、6.98%、21.93%,管道运输基本建设投资增长最快。从所占交通基础设施投资比率来看,铁路与公路投资比率波动较大,从2017年以后,所占比率开始下降,水运、航空、管道投资比率一直保持平稳趋势(见图4、图5所示)。总体上看,公路与铁路仍然是国家投资的重点。

从交通运输客运量与客运转量来看,随着经济增长呈快速上升趋势,年均增长率为6.37%、6.71%。同样,货运量与货运周转量也呈快速上升趋势,年均增长率为5.9%、6.63%(见图6、图7所示)。与交通基础设施投资年均增长率相比,交通需求仍然大于交通供给,交通基础设施投资仍将满足不了经济快速发展。

四、 结论

交通基础设施投资实质上是一个复杂的动态系统,它受到各种各样复杂因素的影响。因此,在研究交通基础设施投资的具体情况,除了要考虑自身内部的各种因素的变化,还要考虑其他多种因素共同的作用。由于每个与交通基础设施密切相关的影响因素随着环境的变化不断地发生变化,这就决定了研究交通基础设施投资预测时,不能基于交通基础设施投资的自身封闭系统,而是把它放在“交通—经济”大系统中。实证研究证明,BP神经网络预测模型比传统预测模型更能较全面地反映在大系统环境下各种因素对交通投资的非线性的映射关系,预测精度高,效果比较满意。

参考文献:

1. 匡敏,胡思继,邢培昱,武旭.基于国民经济大系统下的铁路货物运输量预测方法的研究.北方交通大学学报(社会科学版),2003,2(4):21-24.

2. 方庚明.基于多元线性回归的公路客运量发展预测模型.工程与建设,2011,25(2):164-166.

3. 温爱华,李松.基于广义回归神经网络的铁路货运量预测.铁道运输与经济,2011,33(2):88-91.

4. 王文莉,杨俊红.基于灰色理论的铁路客运量预测影响因素优化.微电子学与计算机,2011,28(10):164-172.

5. 李驰宇,李远富,梁东.基于人工神经网络的交通运量预测.交通标准化,2005,(8):130-132.

6. 王维国,张静静.基于BP神经网络的货运量预测方法.物流技术,2005,(7):58-59.

7. 陈福贵,李远富.基于BP神经网络的铁路货运量预测.铁道货运,2005,(9):15-17.

8. 国家统计局.中国统计年鉴(2011),北京:中国统计出版社,2011.

基金项目:高速磁浮交通系统在我国综合运输体系中的地位和作用(项目号:40011012201005)。

作者简介:宗刚,北京工业大学经济与管理学院常务副院长、教授、博士生导师;任蓉,北京工业大学经济与管理学院博士生;孙玮,北京工业大学经济与管理学院博士生。

城市道路交通流预测系统研究 篇4

随着智能交通系统的逐步发展, 智能交通管理系统和先进的旅行者信息系统在城市交通管理中发挥着越来越重要的作用, 而城市道路交通流的实时预测是上述2个系统的重要基础, 因此, 近年来其关注程度日益增加。

欧盟在其CAPITALS plus项目中选择了巴黎、罗马、马德里等城市作为示范城市, 将交通预测工具的开发作为其中的重要内容[1]。英国在其未来10 a ITS项目Traffic England中开发了交通预测的功能, 可以给出主要道路未来时段的预测参数[2]。德国Bavarian州政府发起的Bayern Online的项目开发了BayernInfo的网站, 其主要功能之一就是为出行者提供长、中、短期的交通流预测信息, 采用了1个名为“ASDA-FOTO”的交通模型[3]。美国有一些州、市正在研究和建立交通预测系统[4], 如佛罗里达州奥兰多市在I-4州际高速公路上[5]。国内学者对交通流短期预测模型进行了一定的研究, 但目前尚无成功的应用案例[6,7,8], 本文结合实际实施需求对城市道路交通流预测系统进行研究, 并提出了实施方案, 实施结果表明本方案具有良好的可行性。

1 需求分析

城市道路交通流预测系统是城市智能交通系统的重要组成部分, 亦是城市道路交通管理工作的重要辅助决策支持工具, 系统建设的需求主要包括如下方面:

1.1功能需求

1) 能够集成城市现有和未来安装的各类检测器的信息和数据。

2) 能够实现对城市道路网络交通流状态的实时预测以及交通状况中长期预测。

3) 可以对城市道路交通综合态势进行在线综合评价、非常态交通状态预警与交通拥挤识别等。

4) 能够对路口、路段、区域的道路交通服务水平给出实时评价, 为道路交通管理决策提供支持。

5) 能够实现与其他系统的进一步集成, 为其他系统提供预测数据。

1.2性能需求

1) 实时性。

对事务的响应时间一般在5 s以内, 对于大量的交通流数据统计应该在30 s以内。

2) 可靠性。

系统具有双机热备的基本功能, 具有良好系统安全功能。在高负荷情况下, 能够实现降级模式, 满足50%的可访问率。

3) 可扩展性。

系统应具有灵活的接口功能, 可以增加新的交通流检测系统的数据或给未来其他有需求的系统提供预测数据。

2 系统结构设计

2.1逻辑结构

根据系统需求分析及现有基础设备和数据情况, 本系统的逻辑结构如图1所示。

系统主要包括3层:

1) 基础数据层。为交通流预测系统提供多源异构数据来源, 主要包括城市现有交通检测系统, 如交通信号控制系统、旅行时间检测系统、微波交通流检测系统、浮动车检测数据等。

2) 数据处理及计算层。该层是交通流预测系统核心部分, 主要由如下几部分构成:①数据融合, 完成对基础数据层多源异构数据的融合处理, 为综合数据库提供实时、可靠、较为准确的检测数据;②综合数据库, 处理和存储交通流预测系统所需要的各类数据, 包括检测到的数据和预测数据以及各类统计分析结果;③模型库, 主要存储交通流预测模型;④知识库, 主要存储交通流状态模式识别所产生的交通流时空关联关系, 为预测提供基础参数配置;⑤GIS平台, 为交通流预测系统提供GIS平台显示所需要的各类空间数据及空间属性数据。

数据处理及计算层的最主要成果就是各粒度、各步长的多类交通流参数的预测值。

3) 应用层。主要包括交通流预测系统所支撑的各类应用系统, 包括VMS信息发布系统、个性化出行路径规划、诱导系统, 交通管理辅助决策支持系统等。

2.2物理结构

物理结构如图2所示。在物理结构中, 最主要的是实现系统核心功能的4个服务器, 各服务器的主要功能如下:

1) 数据库服务器。

数据库服务器主要运行着支持交通流预测系统的综合数据库, 其功能主要包括:①从交管局现有的数据中心获取原始数据, 进行数据融合, 转化成满足预测系统要求的规范化的基础数据, 存储到系统的综合数据库中;②存储实现预测预报系统各项功能所需要的所有基础、过程以及成果性的交通流特性数据;③响应其他3个服务器对交通流特性数据的读取、写入、更新等请求。

2) 计算服务器。

计算服务器主要实时运行着交通流预测系统的各类预测模型, 其功能包括:①从数据库服务器提取交通流特性基础数据, 据此进行交通流预测、路网动态服务水平评价、拥挤评价、交通事件预警等核心功能相关的计算任务, 并将计算结果传输到数据服务器进行存储;②响应来自Web应用服务器的针对各项计算任务的逻辑控制指令, 按照请求修改各种配置信息, 从而改变计算逻辑;③响应来自Web服务器的计算任务指令, 执行响应的计算任务, 并将计算结果传输给Web服务器。

3) GIS服务器。

主要功能为:①存储支持预测预报系统所有功能表现所需要的城市路网GIS数据;②响应来自Web服务器及应用服务器的请求, 将请求解析为相应的GIS数据需求和交通流特性数据需求, 通过数据服务器获取交通流特性数据, 将其与GIS数据进行综合处理, 得到可视化信息, 并将其传输给Web服务器;③响应来自Web服务器的GIS信息修改指令, 按照要求修改GIS信息。

4) Web应用服务器。

用于响应来自网络上其他终端的网页浏览请求, 将用户请求解析为对GIS数据、交通流特性数据以及计算功能的需求, 分别对其他3台服务器发出请求, 并接收相应的返回信息, 对其进行综合处理, 形成返回给浏览器用户的页面信息。

该系统通过GUI (graphical user interface) 对外提供服务的基本形式为:用户通过各种终端访问Web服务器, 通过面向浏览器的各项操作, 向Web服务器发出请求, 而Web服务器将用户请求解析为对自身及其他3台服务器的请求, 依次分发并接收相应的返回信息, 再将这些信息进行综合处理, 形成返回给用户的页面信息。

预测系统第2种提供服务的主要形式为向其他应用系统提供预测结果:根据其他系统的需求, 预测系统将预测结果的数据在存入本系统综合数据库的同时传送给其他有需求的系统, 或者其他系统定时访问预测系统的数据库来获取实时预测数据, 再由其他系统根据需求进行预测数据的2次处理及应用。

3 功能设计

3.1系统主要功能

1) 数据融合及综合数据平台。

建立面向城市不同检测系统的数据融合模型及方法, 对多个检测系统的异构数据进行多层次的融合处理, 并将处理后的数据存储在系统综合数据平台中。

2) 道路交通流预测及模型更新。

此功能为本系统的核心功能, 主要是基于综合数据平台, 利用交通流预测模型进行实时交通流预测, 给出各个交通流参数的预测值, 包括流量、速度、占有率、旅行时间等, 预测步长为5、15、30 min。

本系统中的预测模型采用的是组合模型与非参数回归相结合的方式。基于历史数据、实时数据、空间关联数据等, 组合模型通过傅里叶历史估计模型、自回归模型和邻域回归模型3个子模型来进行预测, 并且通过随预测误差实时更新的权重系数将三者结合起来提供预测值。同时再进一步与非参数回归模型融合, 并提供最终的预测值。

交通流预测模型具有随着系统的实施不断更新的能力, 预测模型中的修正系数在系统实施过程中根据预测精度的变化及道路交通流状态的变化而不断修正, 最终不断提高预测精度和模型的适应性。

3) 交通状态分析与评估功能。

通过编辑交通状态评价指标, 进行交通状态等级评价, 可以对城市道路交通流状态按照路段、路口、区域等不同层面进行分析与评估, 同时可以对道路交通拥堵状态进行分析, 利用检测及预测数据, 可以对道路交通事件进行评估与判断。

4) 交通信息服务。

该系统所产生的交通状态评估结果以及交通流预测预报的信息可以提供给其他城市道路交通管理系统, 以及其他有需要的单位或用户。同时亦可提供给信息发布系统用以向公众发布信息。

5) 城市道路交通流趋势分析。

利用系统存储的大量交通流数据, 可以从时空两方面掌握城市道路交通流的变化趋势, 分析不同区域、路口、路段间道路交通流的相关性, 以及城市不同区域、路口、路段交通流的时间变化趋势和特点, 从而为城市道路交通管理提供支撑。

3.2系统主要功能模块

1) 计算模型模块。

包含短时交通流预测、通行能力评价、服务水平评价、拥堵状态识别等相关模型算法, 实现系统的核心功能。

2) Web服务器模块。

处于系统的最前端, 负责与用户进行交互。

3) GIS模块。

负责对城市地理信息数据的管理、维护、查询、表现。各个模块的责任与依赖关系如图3所示。

4 系统数据流

本系统数据流程如图4所示。在预测模型工作过程中主要有如下3个数据流程:

1) 经过融合的最新的检测数据加入到预测数据序列中, 更新下一步预测模型进行预测所需要的实时数据序列, 并将更新后的数据序列传送给综合预测模型。

2) 将经过融合的最新检测数据加入到历史数据库中更新历史数据库, 利用更新后的数据进行交通流特征的匹配分析, 从而更新交通流模型的基本参数, 如不同检测点之间的时空关系参数等, 然后将更新后的参数与历史数据传送给综合预测模型。

3) 利用更新后的历史数据库进行上一时段预测结果的误差分析, 根据误差分析更新综合预测模型的基本配置参数, 然后将更新后的配置参数传送给综合预测模型。

在上述更新后的参数及数据的基础上, 综合预测模型进行模型参数的更新乃至模型形式的更新, 并利用更新后的数据和模型进行交通流参数预测, 给出预测值。

5 开发实施

根据系统功能需求, 制定如下系统开发实施技术方案:各类服务器的操作系统选用Windows Server 2003操作系统、数据库选用Oracle 10g数据库、Web服务器采用IIS6。Web GIS的开发与运行平台选用ESRI的ArcGIS Server 9系列产品, 客户端选用Windows 98以上版本的操作系统, IE6.0以上版本的浏览器。本系统的开发环境采用Microsoft Visual Studio 2008, 开发语言采用C#/C++。

在上述实施方案指导下, 本文研究的系统在北京市现有道路交通流检测系统的基础上进行了实施, 图5为系统运行界面。

系统的数据来源主要包括目前北京市的快速路交通流检测系统 (目前可以获得11条快速路600多个检测器每2 min的流量、速度、占有率数据) 以及信号控制系统的检测数据 (目前可获得2环内及周边部分区域的每30 s的流量、速度、占有率数据) , 预测的交通参数主要包括流量、速度、占有率等。有关预测模型将另文介绍。系统目前已经开始测试运行, 测试结果表明, 本系统目前速度的预测平均精度可以达到85%, 多数断面可以达到90%以上 (所有断面精度在52%以上) , 个别断面可以达到95%以上, 同时, 经过数月的实施运行, 系统保持了7*24小时的运行模式, 性能稳定。因此上述系统技术方案及实施方案具有良好的可实施性。

6 结束语

结合国内城市交通状况, 分析了现阶段在我国城市研究开发城市道路交通流实时预测系统的系统需求, 基于此提出了系统的逻辑结构、物理结构、主要功能及数据流等, 在逻辑结构中主要研究了基础数据层、数据处理及计算层以及应用层, 在物理结构中主要研究了4个核心功能服务器:数据库服务器、计算服务器、GIS服务器和Web应用服务器。最后给出了系统实施的技术方案。结合北京市实际系统开发情况接了系统的实施情况, 实际应用表明本文提出的系统结构、实施方案具有良好的可行性和实用性, 可以为我国城市交通管理中类似系统的研究与开发应用提供良好的借鉴。

摘要:城市道路交通流实时预测是未来城市智能交通系统的重要支撑, 近年来受到较多的关注。文中结合国内城市交通状况, 分析了城市道路交通流实时预测系统的系统需求, 包括功能需求和性能需求, 在此基础上提出了系统的逻辑结构和物理结构。逻辑结构主要包括基础数据层、数据处理计算层以及应用层, 提出了物理结构中的4个核心功能服务器:数据库服务器、计算服务器、GIS服务器和Web应用服务器。提出了系统的主要功能和4个主要功能模块, 研究了系统的数据流过程, 给出了系统实施的技术方案。经过实施检验, 所提系统结构与技术方案具有良好的可行性。

关键词:交通流预测,系统结构,功能模块,数据流

参考文献

[1]Europa.Capitals Plus TR 4029[EB/OL]. (2005-11-01) [2007-11-01]http://cordis.europa.eu/telematics/tap_transport/research/projects/capital-splus.html

[2]Highways Agency of the department for transport.Traffic information[EB/OL]. (2007-11-01) [2008-11-10]http://www.highways.gov.uk/traffic/traf-fic.aspx

[3]The Bavarian Ministry of the Interior.BayernInfo[EB/OL]. (2007-11-01) [2008-11-01]http://www.bayerninfo.de/vib/localeSwitcher.do;jses-sionid=886CA5A240078506034F0A4EA5B10351?language=en

[4]林勇, 李建新, 刘学军.实时交通信息估计与预测系统在美国的发展概况[J].交通运输系统工程与信息, 2006, 6 (3) :34-40

[5]Sherif Ishak, Haitham Al-Deek.Statistical Evalua-tion of Interstate 4 Traffic Prediction System[J].Transportation Research Record 1856, Transporta-tion Research Board, 2003 (1 856) :16-24

[6]王京峰, 梁青槐.基于GIS的城市交通预测系统[J].交通与计算机, 2002, 20 (5) :22-24

[7]郭雪峰.基于数据融合的短时交通流预测与智能交通信号系统的研究[D].湘潭:湘潭大学, 2007

交通流预测研究 篇5

概念:交通运输规划(Transportation planning)是指经过调查分析,预测未来的交通需求,规划交通网络,并加以实施和修正的全过程。

目的:协调各种运输方式之间的关系,在可能的资金、资源条件下,对交通系统的建设、布局、营运等方面从整体上做出最后的安排,以适应社会 及经济发展的需要。

地位:具有战略地位

§3-1 交通运输规划调查

交通运输规划调查→科学预测→交通运输规划

概念:交通运输规划调查是一种用客观的手段、测定道路交通流以及与其有关现象的数据,并进行分析,从而了解与掌握交通供给以及交通量等方面的综合资料。

目的:采集规划区域及其毗邻地区的社会经济、交通运输基础设施、运输供给以及交通量等方面的综合资料。

一、交通运输规划调查内容

社会经济系统、运输服务系统和交通活动系统是运输系统分析的三个基本要素。

交通运输规划的任务:建立这三者之间的定性及定量关系,求得它们之间的相互协调与平衡发展。

1.土地利用调查

干线公路交通量统计分析与预测 篇6

公路交通量统计是指在单位时间内,对通过公路每一断面实际车辆数进行记录统计。交通量计算统计指标,一种是自然交通量,单位为veh/d(辆/日),男一种标准交通量(按照一定的折算系数换算成当量数),单位为pcu/d(当量标准小客车/日)。交通量统计一般取平均值,有日平均交通量、月平均交通量、年平均交通量。

交通量调查统计资料的应用

交通量调查统计资料应用主要表现在以下几个方面:

为公路养护管理提供依据。公路管理部门在编制公路日常养护管理计划和养路费安排中,该线路或路段的交通量指标,特别是重型车辆的占有率,是编制养护计划的重要依据。

为交通管理提供依据。公路交通量的大小,高峰时段、拥挤度等指标是制定交通管理措施和设置安全标志的重要依据。

为路网规划和公路设计提供依据。通过对历年交通量数据分析。预测未来的交通量发展趋势,是公路规划、设计和可行性研究中的主要依据。

为评定现有公路使用情况提供依据。通过对现有交通量的分析,可以判断出现有公路交通的拥挤度和使用状况,是否可以满足交通运输需要以及评判公路使用的安全性、合理性和经济性。

交通量调查资料的分析

G322线五塘观测站,观测点桩号为K21+100,公路技术等级为二级,路面宽12米双车道,观测里程为33.33公里(K10+630-K44+185),建有专门的观测房,并安装全自动交通流量观测系统,采用技术含量较高的移动网络传输技术,实行全年365天,全天24小时不间断的交通流量纪录、车型分类、数据自动上报湖南省公路局交通数据采集中心,减少了由人工纪录采集数据和上报过程产生的误差,大大提高了交通流量数据的准确性。

根据表1可知,G322线路该路段交通量的高峰时段是1~2月份和9~12月份,这几个月是公路部门公路养护和交通管理上需要重视和加强工作力度的时段。

根据表2可知,G322线路该路段交通量呈逐年上升趋势,年平均增长率为34%。

交通量的预测

交通量的预测可以为路网规划和公路设计提供依据。交通量的预测方法很多,本文用一元回归分析法对该线路路段未来交通量进行预测。

G322五塘观测站历年交通量如表3所示。根据表3数据,分析交通量与时间变化的线性关系,可以得出交通量预测数学模型为yt=354.69t-705399.67(r=0.94797,r2=0.89865,由此判定回归方程拟合度较好,代表性较高),t为年份,yt为预测年度第t年平均日交通量(混合当量数)。预测该线路路段远景交通量见表4。从表4可以看出,交通量随着时间呈自然增长趋势,主要是因为社会经济不断发展,人均生活水平不断提高,人均拥有车辆数增加等因素影响。只有不断改善路网结构,交通设施,提高交通管理和服务水平,才能满足人们的出行要求。

交通流预测研究 篇7

关键词:短时交通流预测,IOWA,指数平滑法,SARIMA,BP神经网络

短时交通流预测[1]是指在某一时刻t对下一决策时刻t+Δt乃至以后若干时刻的交通流作出实时预测, 一般认为Δt的时间跨度不超过15 min。基于实时数据分析的短时交通流预测, 是智能交通系统中提供交通信息、进行交通诱导与控制的关键, 其研究备受关注。迄今为止, 短时交通流的预测方法可分成两类:一类是以数理统计和微积分等传统数学和物理方法为基础的预测模型, 比如指数平滑模型、时间序列模型、卡尔曼滤波模型等;另一类是以现代科学技术和方法为主要研究手段而形成的预测模型, 如神经网络模型、谱分析法、混沌时间序列等。不同的方法具有不同的特点, 本文选取了指数平滑法、季节自回归求和移动平均模型、BP神经网络模型作为三种基本的预测模型, 再利用IOWA算子将这三种模型进行组合预测。

组合预测就是综合利用各种预测方法所提供的信息, 以适当的加权平均形式得出组合预测模型, 其最关心的问题就是如何求出加权平均系数, 使得组合预测模型更加有效地提高预测精度。本文引进IOWA算子, 通过每个单项预测方法在样本区间上各个时点的拟合精度的高低按顺序赋权, 建立以整体预测误差平方和最小为目标的组合预测模型。该组合模型充分考虑到各个间隔时段的预测精度, 克服了传统的加权几何平均组合预测方法的缺点, 充分体现了短时交通流时变性的特点。

1 诱导有序加权平均算子概念及其组合预测模型

1.1 诱导有序加权平均算子概念

有序加权平均算子和诱导有序加权平均算子[2]是美国著名学者Ronald R.Yager提出的一种介于最大与最小算子之间的信息集成方法, 广泛应用于集结各决策信息或方案优选。

式 (1) 中, bi是短时交通预测是a1, a2, …, am中按从大到小的顺序排列的第i个大的数, 则称函数fw是m维有序加权平均算子, 简记为OWA算子。

定义2:设fw (, , …, 为m个二维数组, 令

则称函数fw是由v1, v2, …, vm所产生的m维诱导有序加权平均算子, 简记为IOWA算子, vi称为ai的诱导值。其中v-index (i) 是v1, v2, …, vm中按从大到小的顺序排列的第i个大的数的下标, W= (w1, w2, …, wm) T是OWA的加权向量, 满足

定义2表明, IOWA算子是对诱导值v1, v2, …, vm按从大到小的顺序排序后所对应的a1, a2, …, am中的数进行有序加权平均, wi与数ai的大小和位置无关, 而与其诱导值所在位置有关。

1.2 诱导有序加权平均算子组合预测模型

设{xt, t=1, 2, …, N}为各个时段的交通流量, 设有m种可行的单项预测方法对其进行预测, xt为t时刻的真实值, xit为第i种预测方法第t时刻的预测值, ait为第i种预测方法第t时刻的预测精度, i=1, 2, …, m, t=1, 2, …, N。令

显然, ait∈[0, 1], 因此, 我们将ait看成预测值xit的诱导值, 根据IOWA的定义, 有

a-index (it) 是第i个大的预测精度的下标, L= (l1, l2, …, lm) T是m种单项预测方法在组合预m测中的加权系数, 满足

式 (4) 表明, 组合预测值与单项预测方法无关, 而是与单项预测方法在各个时点上的预测精度的大小密切相关, 可充分体现短时交通流的时变性。

为了求得权重, 本文以N时段总的组合预测误差平方和最小为目标, 建立组合预测模型[3]。

2 短时交通流的预测模型与实例分析

2.1 指数平滑法

指数平滑法[4]是对时间序列由近及远采取具有逐步衰减性质的加权处理方法, 分为一次、二次指数平滑法等, 分别适用于不同类型的时间序列预测, 本文采用了二次指数平滑法。二次指数平滑法是对一次指数平滑后的序列再作一次指数平滑, 利用滞后偏差的规律性对呈线性变化的样本序列建立直线趋势预测方程的一种预测方法。其模型为

式 (6) 中, at=2St (1) -St (2) , ;Yt为样本的观测值, a为静态平滑参数 (0

2.2 季节自回归求和移动平均模型

季节自回归求和移动平均模型[5]是自回归求和滑动平均模型 (ARIMA) 的一种变形形式, 能够采用Box-Jenkins的模型识别、估计和预测程序。

ARIMA是一种由自回归 (AR) 模型和移动平均 (MA) 模型两部分组成的时间序列模型, 并且考虑到模型的平稳性, 进行了d阶差分处理。ARIMA (p, d, q) 用数学公式表示如式 (7) :

式 (7) 中, {y (t) }, {ε (t) }分别表示原时间序列和白噪声序列。φ (B) =1-φ1B-φ2B2-…-φpBp;β (B) =1-β1B-β2B2-…-βqBq;B是后移算子, 即满足:Bny (t) =y (t-n) , n=1, 2, …;是d阶差分。

如果考虑到时间序列的周期性特征, 那么可以对ARIMA模型进行季节差分, 这样就形成了SARI-MA模型:

式 (8) 中, φ (BS) =1-φ1BS-…-φP (BS) P;β (BS) =1-β1BS-…-βQ (BS) Q;BS表示季节后移算子;S和D分别表示季节周期的长度和季节差分的阶数;P为模型中SAR项的滞后阶数, Q为模型中SMA项的滞后阶数。因此, 等式 (8) 所表示的SARIMA模型被称为SARIMA (p, d, q) (P, D, Q) S模型。在本文中, 最终确定预测模型的结构为SARIMA (3, 0, 4) (3, 1, 4) 96。

2.3 BP神经网络模型

BP神经网络[6], 即反向传播 (back propagation) 神经网络, 主要是用于解决多层神经网络结构中的隐层单元无法直接计算误差的问题。BP神经网络分为两个阶段:正向传播过程和反向传播过程。其中, 正向传播过程完成把信息从输入层经隐层向后逐层传递, 并计算各单元的输出值, 反向传播过程将输出误差逐层向前传递, 从而计算出隐层各单元的误差, 并用此误差修正前一层的权值。误差反向传播的学习算法简称BP算法, 其基本思想是梯度下降法, 即采用梯度搜索技术, 以使网络的实际输出值和期望输出值的误差均方值最小为目标, 具体算法参见文献[6]。

在本文中, 设q (t) 为t时刻路段上的交通流量。模型采用当前时间段和前s-1个时间段的交通流量来预测未来时间段的交通流量, 即q (t) , q (t-1) , …, q (t-s+1) 作为样本t时刻的输人值, q (t+1) 作为样本的输出值。经试算, 本文的模型选取输入层为4个神经元, 隐层为9个神经元, 输出层为1个神经元的神经网络模型, 即输入层为q (t-3) , q (t-2) , q (t-1) , q (t) , 输出层为q (t+1) 。

2.4 实例分析

本文采用San Francisco Bay的某一断面连续两周工作日共10 d每15 min的交通流数据进行实例验证。数据样本共有960个, 具体如图1所示。

本文利用前864组数据来预测后96组数据 (24h) 。根据上文的方法介绍及其借用Matlab编程软件, 预测结果如图2。

接着, 利用Matlab软件, 根据诱导有序加权平均算子公式 (4) , 计算IOWA算子组合预测值。再根据模型式 (5) , 建立二次规划模型如下:

利用Matlab软件, 求得权系数为:l1=1, l2=0, l3=0。则得到IOWA算子的预测结果如图3所示。

为了比较预测方法的优劣, 本文选取了三个衡量指标[6], 设原始数据序列为xt, 预测结果为。具体衡量指标如下。

2.4.1 平均绝对误差

平均绝对误差 (bean absolute error, MAE) 反映预测值与真实值之间的误差的绝对数。

2.4.2 均方误差

均方误差 (mean square error, MSE) 不仅能反映误差大小, 还能描述误差分布的集中与离散程度, 均方误差越大, 误差序列越离散, 预测效果越不好。

2.4.3 平均绝对百分比误差

平均绝对百分比误差 (mean absolute percent error, MAPE) , 也称为平均相对误差。它是一个综合评价整个预测过程预测性能高低的指标。相对误差反映预测偏离观测的程度, 在进行不同观测序列预测效果的比较时, 这一指标比绝对误差要好。

按上述三个衡量指标, 分别计算三种单项预测方法和诱导有序加权平均算子组合预测的误差指标, 具体如表1所示。

根据表1, 从MAE可以看出, IOWA算子组合预测模型比SARIMA模型和BP神经网络模型在该值上接近减少了一半, 相对指数平滑法, 其效果更是明显;从MSE可以看出, IOWA算子组合预测模型不仅误差减小, 误差分布也较集中;从MAPE看出, IOWA算子组合预测模型该值均小于其他模型, 特别是指数平衡模型和BP神经网络模型, 说明了IO-WA算子组合预测模型在整个预测过程中的预测性能最高, SARIMA模型次之。因此, IOWA组合预测模型的各项指标明显优于其他的模型。

3 结论

本文首次将IOWA算子应用到短时交通流预测中, 以指数平滑法、SARIMA模型和BP神经网络模型为单项预测模型, 建立IOWA算子组合预测模型。在实际数据验证的基础上, 结果表明了IOWA算子组合预测模型预测效果均比其他模型优越, 有效地提高了短时交通流的预测精度。从而说明了IOWA算子组合预测模型在综合利用各种单项预测模型优点的基础上, 充分抓住了短时交通流的非线性、时变性、不确定性等特点, 获得很好的短时交通流预测表现。

参考文献

[1] 邵春福, 熊志华, 姚智胜.道路网短时交通需求预测理论、方法及应用.北京:清华大学出版社, 2011

[2] Yager R R.Induced aggregation operators.Fuzzy Sets and Systems, 2003;137 (1) :59—69

[3] 蔡正高.朱敦赣.4种诱导有序加权平均模型的构建.合肥学院学报 (自然科学报) , 2008;18 (4) :1—5

[4] 黎锁平, 夏压峰, 李俊.一类推广的指数平滑优化模型性质及算法的研究.甘肃工业大学学报, 2002;28 (3) :105—110

[5] 孙湘海, 刘潭秋.基于SARIMA模型的城市道路短期交通流预测研究.公路交通科技, 2008;25 (1) :129—133

[6] 王娟.短时交通流量混合预测方法研究.西安:长安大学, 2007

交通流预测研究 篇8

上个世纪六十年代开始,V.Vapnik 等人就对支持向量机(SVM,Support Vector Machine)理论进行探讨与研究,并逐步形成了一整套较为完整的理论体系。它是一项在统计学习理论基础上发展而成的新技术。支持向量机是一小样本数据为基础的一种机器学习方法,适合样本采集数量少的分类和预测,相对于大样本理论算法,样本采集经济,分类预测精度高、泛化能力强等。在2006年,杨兆升等人提出的一种支持向量机的交通流预测模型,该模型在收敛时间、泛化能力和最优性能等方面均优于神经网络等基于大样本集的预测方法[2]。 但也存在有一定的不足,下面介绍LS-SVM模型与之对比说明。

1 LS-SVM模型

LS-SVM模型是将SVM算法进行改进的一种模型,它是将SVM中的损失函数以平方的形式表示,将SVM中的不等式约束转化成等式约束。

根据Suykens在1999年提出的LS-SVM理论,输入空间R″通过非线性函数φ(·)被映射到一个高维的特征空间H。在特征空间,采用形如y(x)=wφ(·)+b的表达式来估计未知的非线性函数,其中w∈H、b∈R是待确定的参数[3]。给定训练数据集{xi,yi}undefined,其中l为训练样本数,xi∈Rn是输入向量,yi∈R是相应的输出。

在SVM的求解过程中凸规划问题需要通过二次规划的方法解决,而二次规划需要计算和存储核函数矩阵,若训练样本集为N,则二次规划需要计算和存储的矩阵大小为N2×N2,因此内存占用量较大。利用LS-SVM可在一定程度上解决SVM的计算复杂性问题,计算和存储的矩阵大小为(N+1)×(N+1),很大程度上减少了计算量,而且将SVM中的求解二次规划问题转化成求解一组线性方程组,简化了计算过程[4]。

根据结构风险最小化原则,综合考虑函数复杂度和拟合误差,用于函数估计的LS-SVM问题可以表示为:

undefined

其中目标函数的第一项模型泛化能力相对应,而第二项表示模型的精确性,常数γ是模型的泛化能力和精度之间的一个正则化参数,ei∈R是第i个数据的实际输出与预测输出之间的误差。为解决上述优化问题,需要把有约束优化转变为无约束优化,为此,定义如下的Lagrange函数:

undefined

式中,ai∈R为Lagrange乘子。上式分别对w,b,ei,ai求偏微分并令它们等于0,由KKT条件,得到:

undefined

式中i=1,2,…,l。消去w,ei,定义核函数K(x,xi)=φ(x)·φ(xi)代替非线性映射,则需要求解的优化问题转化为求解线性方程组

根据式上式可求得a*=[a*1,a*2,…,a1*],b*。则LS-SVM的函数估计模型为:

undefined

若能够构建出符合Mercer定理的核函数K(xi,x),即可能求得预测值y(x)。

2 小波核函数

LS-SVM模型是通过选择的核函数将输入变量从低维空间变换到一个高维空间,将在低维空间的非线性问题转化为线性问题分析求解。因此构建合理有效的核函数是支持向量机算法的一个关键所在。

2.1 核函数的条件

定理1(Mercer定理)[3]:令X是Rl的紧子集,假定K是连续对称函数,存在积分算子Tk∶L2(X)→L2(X),使得

(Tkf)(·)=∫XK(X)f(X)dX (6)

是正定的,也就是

∫K(X,Z)f(X)f(Z)dXdZ≥0 ∀f∈L2(X) (7)

对所有的f∈L2(X)成立。然后扩展K(X,Z)到一个一致收敛的序列(在X×X上),这个序列由Tk的特征函数φj∈L2(X)构成,归一化,使得‖φj‖L2=1并且γj≥0,则有

undefined

Mercer定理的条件等价于,对X的任意有限子集,相应的矩阵式半正定的的命题。满足这个定理的函数,通常称为Mercer核。

定理2[3]:平移不变核函数K(X,Z)=K(X-Z)是一个允许支持向量核,当且仅当K(X)的傅里叶变换

undefined

成立。

2.2 小波核函数

定理3[5]:设φ(x)是一个母小波函数,a、m分别是伸缩、平移尺度因子,则小波核函数为:

undefined

x,x′∈Rd;xi,x′i,ai,a′i,mi,m′i∈R,ai,a′i≠0

证明:对∀g(x)∈Rd有

undefined

因此K(x,x′)满足Mercer定理,定理得证。

选择常用的Morlet小波函数undefined来构建平移不变小波核函数定理4[6]:满足平移不变核函数的Morlet小波核函数

undefined

证明:略

将Morlet小波核函数作为LS-SVM的核函数所构建的数学预测模型即为LS-WSVM模型。

3 相空间重构

对于预测数据集是一个一维的数据样本,利用相空间重构可以将一维时间序列变换到N维空间里,并且能够保持重构后的相空间和原始序列的微分同胚性,以便在一维时间序列的演变中得到整个系统的规律,以达到提高预测效果和控制水平的目的。

如果需研究的交通流时间序列为y(t),t∈(1,N);m为嵌入维数,τ为时间延迟量, M=N-(m-1)τ,N为重构之前交通流的个数,M为经过重构后的相点个数;则交通流时间序列经过重构之前的一维时间序列是:{xi,i=1,2,…,N},相空间重构之后获得的交通流时间序列的是:{Xi=(xi,xi+τ,…,xi+(m-1)τ),Xi∈Rm,i=1,2,…,M}[7]。

4LS-WSVM模型在城市交通流预测中的应用

本文选用美国加利福尼亚州PeMS系统中圣安娜高速公路(Santa Ana Freeway)线圈检测器采样2012年05月14日至18日的交通流数据作为实验数据,数据采样间隔为5分钟,共1440个数据,采用LSSVMlabv1_8工具箱仿真。

本文采用H.S.Kim等人在1999年提出的C- C算法估计延迟时间为τ和嵌入维m,它利用时间序列的统计结果得到,具有算法代价小、稳定可靠、能同时计算τ和 m 等优点。通过undefined的第一个过零点或者undefined的第一个极小值发现时间延迟时间τ=35,通过Scor(t)的最小值发现时间窗口τw=106,从而利用τw=(m- 1)τ换算出嵌入维 m=4。C- C算法的结果如图1所示。

交通流预测仿真步骤如下:

Step1:载入交通流样本数据;

Step2:将一维样本数据进行相空间重构(重构维数m=4,延迟时间τ=35);

Step3:构造重构后的训练样本集和测试样本集;

Step4:将Step3的数据进行预处理;

Step5:选择训练模型初始正则化参数γ和核参数σ2的值(在此取初值γ=100,σ2=0.01),及核函数(小波核函数),用initlssvm函数对模型进行初始化;

Step6:用LSSVMlabv1_8自带的优化函数tunelssvm对模型参数优化;

Step7:分别用函数trainlssvm和simlssvm对模型进行训练和预测;

Step8:预测结果输出;

Step9:程序结束;

本文将前四天的交通流数据作为训练样本集,第五天的交通流数据作为测试样本集,预测值与真实值对比图及绝对误差如图2所示:

为了评价SVR模型的预测性能,本文引入以下评价指标[M]:

平均相对误差:undefined

均方误差:MSE=∑t(Ypred(t)-Yreal(t))2/N

均等系数:undefined

其中 Ypred(t)表示在t时刻的预测值,即t时刻的交通流量预测值;Yreal(t)表示在t时刻的实际测量值,即刻的交通流量的实测值;N 为预测时段长度;EC是评价交通流预测效果的重要指标之一,EC值的大小充分反应了预测的效果的好坏,一般认为EC值大于0.85的预测都被视为较好的预测,凡是EC值大于0.9的预测都被视为满意的预测,EC值越高,则整体预测效果与实际测量值越接近,效果也越接近理想[9]。

LS-WSVM仿真结果数据与SVR模型结果对比如下表1所示:

经计算,LS-WSVM模型预测数据的平均相对误差为9.4%,EC值为0.9407,因此预测精度相对较高,完全能够满足城市交通控制和诱导所需的精度。

5 结论

针对城市短期交通流的非线性和随机性,本文采用LS-WSVM模型并结合相空间重构对5min检测的城市交通流量进行预测。因为传统的核函数(例如高斯核函数)是相关的,甚至是冗余的,使计算量增加,而小波核函数是近似正交的能够以很高的精度逼近任意函数,所以这是传统的核函数所不具备的。小波核函数不仅具有局部分析和特征提取能力,而且其建模能力优于高斯核函数,使预测精度和推广性更好,能够满足交通控制和诱导的要求。由于LS-SVM模型的每一个训练点的拉格朗日乘子几乎都不为零,所以训练时间会过长,而且该模型的参数优化选择还需做进一步的研究。

参考文献

[1]隋亚刚,李瑞敏,郭敏等.城市交通流道路交通流预测预报系统研究与应用[M].北京:中国铁道出版社,2009.

[2]杨兆升,王媛.基于支持向量机方法的短时交通流量预测方法[J].吉林大学学报,2006,36,(6):881-884.

[3]蒋艳凰,赵强利等.机器学习方法[M].北京:电子工业出版社,2009,8.

[4]冼广铭,曾碧卿,冼广淋.最小二乘小波支持向量机的DNA序列分类方法[J].计算机工程与应用,2009,45,(12):222-225.

[5]Mathews V J.Adaptive Volterra filters using or thogonalstructures[J].IEEE Signal Process Letters,1996,3,(12):307~309.

[6]杜贤利.基于最小二乘小波支持向量机的股票期货市场预测[D].江苏大学,2008.

[7]吕金虎,陆君安,陈士华.混沌时间序列预测与应用[M].武汉:武汉大学出版,2002.

[8]向红艳,朱顺应,王红,严新平.短期交通流预测效果的模糊综合评判[J].武汉理工大学学报(交通科学与工程版),2005,29,(6):921-924.

物流园区产生交通量预测的研究 篇9

随着物流园区的分期开发建设,对周边交通的影响逐渐加重,交通影响分析必不可少。其中物流园区产生交通量(新增交通量)预测对于确定交通影响程度、提出交通改善措施等起到至关重要的作用。传统新建项目的交通量预测方法与物流园区情况有所区别,本文主要探讨新建物流园区交通影响分析中新增交通量预测的方法。

1 物流园区分类

物流园区按位置的构成不同划分为集中型和非集中型;按照物流服务内容划分为配送型物流园区、枢纽型物流园区和综合型物流园区;按照物流服务范围划分为国际型物流园区、区域型物流园区和城市配送型物流园区。本文所讨论的物流园区主要指综合型物流园区,具备完善市政设施的综合型的物流枢纽。

2 新增交通量预测

2.1 货运流动产生交通量的预测

对于货运交通量,首先在明确物流园区功能布局的情况下,根据各个区域的货运量或仓储量,结合该区域的货运特征进行预测。

方法一,首先预测各小区产生的交通量,再根据货物空间分布特征加载到各路段,高峰小时货运产生当量交通量计算公式如下:

N=A日/i/α/h×β (1)

其中,N为货车高峰小时交通量吸引量(年前20%高峰小时低限值,即一年中所有小时的参与货物吞吐的车辆数量按从高到低排列,处于20%位置的货车高峰小时吸引量);A日为日吞吐量;i为折减系数,一般i=2,以每天进货量和出货量大致相等为基础进行预测,可以根据作业性质调整;α为货物重量与标准车转换系数,根据仓储及运输性质取值,一般每载货5 t按一辆标准中型货车计算;h为每天平均有效运营时间;β为不均衡系数,包含货运量时间的不均衡以及日进货和日出货车辆的不均衡,一般取2~4。

在此基础上进行交通分配,即将前面预测的各区交通量分配到具体的道路网上去,在物流园区的交通量分配时重点考虑货流的方向。一般情况下物流园区面积较大,有多处出入口,需要根据各个区域货运通道进行分析,结合该区域货运方向分别进行加载。

假设货运量产生区域为i,共i个小区,将园区周边路网分为j个流向,即j个路段,根据物流与人员流动方向,将i个小区的交通量加载到道路网中,最后得出各路段的货运产生交通总量为:

Qj=i=1Ιqij (2)

其中,Qj为路段j上总的交通量;qij为小区i在路段j上的交通量。

方法二,基于王晓宁提出的一种“运量分担法”,首先依据物流量的空间分布将小区物流量分配到各路段上,再根据每个路段上各小区的车辆出行比例、满载率、不同车型的运量等因素,得到小区在路段上的车辆出行总数,再根据车辆转换系数,计算出路段标准交通量。

亦假设i个小区与j个路段,则i小区在路段j上的物流量为:

qij=Qiγij (3)

其中,qij为小区i在路段j上的物流量;Qi为小区i总的物流量;γij为小区i在路段j上的物流量的空间分布比例。

然后再将各路段上的货运量转化为标准交通量,即根据小区i在路段j上的不同车型的雏形比率,满载率以及运载能力,即:

qij=n=1ΝXijAijnBijnCn (4)

其中,Xij为小区i在路段j上的出行车辆总数;Aijn为小区ij路段上第n种车辆出行比例向量;Bijn为小区i在路段j上第n种车辆的满载率;Cn为第n种车型的载运量吨数。

得出小区i在路段j上的出行车辆总数后,根据每种车型比例与该车型车辆换算系数计算出小区i在该路段j上的标准交通量,最后将各小区在某路段上的交通量进行叠加,得到每条路段上的新增交通量。

对以上两种方法进行对比可以发现,两种方法虽然都是基于分区预测的思想,但是预测思路不同。方法一虽然考虑各小区在不同路段上货物空间分布,但是没有考虑车辆在该区域的运行特征;方法二弥补了方法一的缺点,但相比较而言,方法二的所需数据更加难以获得。实际运用时应根据实际情况进行方法的选择。

2.2 人员流动产生交通量的预测

对于人员产生的交通量常采用的方法是根据办公区建筑面积、园区作业量采用吸引发生率法,其重点是选择合适的吸发率数据。国内目前还没有对这方面进行系统的统计,规划人员往往根据不同项目,选择一些与拟建项目类型相同的建筑物对其交通发生和吸引情况进行调查,并且综合考虑进行适当的修改,确定交通产生率。相比之下,美国Institute of Transportation Engineers的《Trip Generation》已经推出至第七版,在4 250个实例调查和分析的基础上,得出了所有类型建设项目的吸发率数据,保证了交通生成预测准确性(见表1)。

随着国内物流园区的发展,使得数据的获取变得可行,可以通过多家相似的物流园区的作业数据进行多元线性回归模型来预测新增交通量。首先调查其他园区的发生、吸引原单位指标,由实测各园区高峰小时非货运交通量与办公服务建筑面积之比算得,然后建立多元回归模型:

其中,y为高峰小时非货运交通量;x1为正式职工数;x2为办公服务建筑面积;x3为日均吞吐量;x4为日交易额。

根据实际情况可以选定具体不同的参数,由调查数据计算得出非货运车辆吸引多元线性回归模型和非货运车辆发生多元线性回归模型,从而得出较准确的数据,实际上,这种方法与美国ITE所做的数据整理原理相似。

同理将非货运产生的交通量加载到路网中,该类交通量主要流向为市区及基地住宅区。最后将货运与非货运交通量进行叠加,即得到整个路网新增交通量。

3结语

项目新增交通量的预测作为其中的重点,对于反馈物流园区的布局有着重要作用。本文基于分区预测的方法重点从项目新增加交通量的货运与非货运思路出发,对货运交通量采用两种不同的思路分别阐述,对于非货运交通量采用吸引发生率法,考虑从多元回归方法获得更加准确的数据。

参考文献

[1]宋华,胡左浩.现代物流与供应链管理[M].北京:经济管理出版社,2000.

[2]彭驰.物流园区交通影响分析研究[D].长沙:长沙理工大学硕士学位论文,2007:7.

[3]张毅上.城市建设项目交通影响分析若干问题研究[D].上海:上海交通大学硕士学位论文,2008:66,83.

[4]沈建武.城市大型商业设施交通影响分析[J].武汉大学学报,2002,27(4):433.

新城区交通生成预测方法研究 篇10

交通需求预测作为交通规划的基础, 其预测结果的精度直接影响到交通规划的效果, 传统的交通需求预测方法基于大量的调查数据, 且土地利用形态基本成熟, 因而具有较高的精度。但城市新区尚未建设, 交通需求预测所依赖的城市居民社会经济特征以及土地利用的基础资料在新城区都难以收集完全。再加上新城区规划年的人口分布和土地利用特征与现状相比一般都有较大的变化, 若仅按照现状交通调查资料建立预测模型势必难以保证模型的准确性, 难以反映规划年的土地利用和交通需求的相关关系。因此, 新城区的交通生成预测必须突破传统思路, 在有限的可用资料情况下, 分析交通生成的根源, 考虑新城区与建成区之间的交通特性差异基础上, 量化土地利用和交通需求之间关系。

2 基于土地利用的交通生成预测

交通生成与土地利用布局及开发强度密切相关, 下面在对城市交通需求与土地利用的相互作用关系分析基础上, 考虑了出行的生成机理及其与不同土地利用性质的相关关系, 通过引入区位影响系数和可达性两个指标, 量化土地利用与交通生成之间的关系, 给出面向新城区的交通需求预测方法。

2.1 土地利用与交通需求关系

土地利用是是产生交通的根源。不同的土地利用布局、性质和强度, 对应着不同的交通发生量、吸引量和交通分布形态。各小区交通产生和吸引量不仅与城市新区交通生成总量大小成正比, 而且与其内部各类用地面积及土地利用强度密切相关[2]。

土地利用的状况将决定交通需要, 土地开发是产生以该区为起点的新出行或吸引其它区的新出行。不同区位是相同用地性质两块地交通特征存在较大差异。在研究土地利用与交通需求预测之间关系时, 区位是重要因素。因此, 本文从以下三方面考虑土地利用区位信息对交通需求影响:①新城区在整个城市中的地理位置和功能结构;②交通小区在整个新城区的地理位置;③小区功能定位, 主要体现为该小区土地利用的构成。从城市人口土地利用交通需求相关关系机理出发, 建立交通需求与城市人口和土地利用直接相关的交通生成预测模型。

2.2 基于土地利用区位信息—交通生成预测方法

2.2.1 土地利用区位影响因素的确定

交通生成中, 各个交通小区的居民出行吸引会受到建筑情况、传统地位、用地安排等各种因素的影响, 反映交通区特性对出行吸引影响的交通区特性系数是决定交通生产计算的关键。交通区特征系数一般应考虑就业岗位、就学人数、商业体量、绿地规模和文化娱乐设施规模等。为进一步细化考虑到新城区内部各小区的土地利用区位信息对出行特征的影响, 衡量新城区内部各种土地利用之间联系的方便程度, 引用“可达性”概念, 即通过对土地利用的空间位置和这些为土地利用服务的运输综合考量, 对在相互位置上的土地利用方便, 以及经过运输网到达那里容易或困难的描述, 来研究交通对土地利用反作用的关系[3~4]。本文考虑小区可达性和土地利用区位信息定义交通小区区位势LP的表达式为:

式中:LP———区位势;

k———比例系数

L———交通可达性;

q———聚集规模质因子;

s———聚集规模量因子;

α———交通可达性因子对区位势增长贡献的弹性系数;

β———综合聚集规模因子对区位势增长贡献的弹性系数, 用来反映集聚和比邻效应。

交通区位影响系数Yi定义为:交通区Yi的区位势LPi相对于城市标准区的区位势LP0的比值, 即:

2.2.2 基于交通区位影响系数的交通生成预测

传统交通生成预测主要是基于城市人口和土地利用与交通需求的相关关系, 根据小区土地利用特征等因素来预测就业及岗位数, 再建立出行与就业、就业岗位等因素的相关模型, 交通需求与土地利用之间的关系需要通过就业岗位建立关系, 无法直接揭示交通需求生成机理, 精度较高建模过程复杂[5]。因此, 基于土地利用区位信息—交通生成预测模型的基本思路是根据小区各类用地面积和权重以及各个小区的产生和吸引区位势, 按照一定规则将出行总量分配至各交通小区。根据这个思路, 按用地类型分别建立交通产生和吸引模型, 并在模型中引入区位影响系数, 以反映小区土地利用强度和交通可达性对交通需求的影响。其预测流程如图2所示。

本文采用了出行强度预测方法, 并用区位信息对其修正, 得到了出行产生预测模型:

式中:Oi———交通区i出行产生量 (次/日) ;

Yig———交通区i的产生区位影响系数;

kp———城市居民平均日出行次数 (次/日) ;

xi———交通区i人口数。

出行吸引预测用单位土地利用面积的出行吸引率来预测, 相应的交通吸引预测模型为:

式中:Di———交通区i出行吸引量 (次/日) ;

Yia———交通区i的吸引区位影响系数;

kij———交通区i第j种土地类型的出行吸引权重值 (次/万m2) ;

xij———交通区i第j种土地利用类型的土地面积 (m2) 。

3 实例分析

标营新区位于武鸣县城区东南, 规划定位为:集现代行政办公、金融商贸、会展博览、文化休闲、居住生活于一体的交通便利、环境优美、生态型的综合功能区。本次交通需求预测范围为5.99km2的区域, 范围内道路系统情况如图3所示。

3.1 交通小区划分

规划新区内由快速路、主干道、次干道和支路组织成方格网状, 其中主干道为“二横三纵”, 次干道为“一横二纵”, 其余为支路。根据《南宁市武鸣县城厢镇标营新区控制性详细规》中所确定的土地利用情况、城镇用地功能布局, 结合规划路网的分布将研究范围划分为25个交通小区, 其中1~15号小区为内部小区, 16~25号为外部的交通小区。交通小区划分图如图4所示。

3.2 交通小区的土地利用

根据《南宁市武鸣县城厢镇标营新区控制性详细规》, 统计得1~18号交通小区的各类用地统计结果如表2所示。本项目中交通小区中各类用地的权重值根据调查数据的回归得到, 各类用地对交通吸引的影响权重取表1中的值。

在一个交通小区中存在多种用地类型, 具有不同的区位势。运用式 (1) 、 (2) , 对交通产生和交通吸引区位影响系数分别计算。得到规划年内各交通中区交通产生、吸引区位影响系数如表3所示。

3.3 交通生成预测结果

根据表1~表3的有关数据, 运用式 (3) 、 (4) , 计算得到各交通小区的出行产生量及出行吸引量。预测标营区规划年规划年高峰小时各小区各类用地交通生成量统计图和分布图5~6所示。

4 结束语

新区交通需求的预测是一项非常重要的工作, 本文主要根据新区的特点, 对新区交通生成预测方法进行了重点研究, 以城市新区人口发展规划和土地利用规划为基础, 对交通生成与土地利用关系分析基础上, 提出了在缺少现状交通出行调查资料情况下, 考虑交通区位影响系数和交通可达性两个条件进行交通生成预测的模型和方法。但现状交通调查资料的不完整性和发展过程中诸多不确定因素, 城市新区交通生成预测模型中部分参数的确定仍带有一定经验成分, 故其量化方法仍待进一步研究。

参考文献

[1]Boamet Marlon, Crane Randall.The Influence of Land Use on Travel Behavior Specification and Estimation Strategies.Transportation Research Part A.2001, 35 (9) :823~84.

[2]余继东, 吴瑞麟.新城区居民出行生成和分布预测模型研究[J].武汉城市建设学院学报, 1999, 16 (4) :30~33.

[3]杨敏, 陈学武, 等.基于人口和土地利用的城市新区交通生成预测模型[J].东南大学学报, 2005, 35 (5) :815~819.

[4]吴家友, 刘术红.基于区位势能的新城区总体交通需求预测模型探讨[J].重庆交通学院学报, 2003, 22 (4) :93~95.

上一篇:行政事业机构下一篇:建设运动休闲化的校园