客流数据异常分析报告

2024-04-10

客流数据异常分析报告(精选8篇)

篇1:客流数据异常分析报告

。。供电所异常数据调取分析记录

1.数据调取时间段:

****年****月***日至***月***日 2.单位时间内采集失败情况:(重点)

3.单位时间内零电量用户情况:(重点)

4.单位时间内表计倒走情况:(重点)

5.单位时间内表计电压失压情况:(重点)

6.单位时间内反向电量异常情况:

7.单位时间内表计时钟异常情况:

8.单位时间内电压断相情况:(重点)

9.单位时间内电能示值不平情况:

10.单位时间内电流不平情况:

11.单位时间内电压越下限情况:

12.单位时间内电压不平衡情况:

13.单位时间内抄表参数与主站不一致情况:

14.单位时间内用户表计电量异常情况:(重点)单户断断续续用电,时高时底等等。15.其他可能影响线损情况的数据:

16.发现问题汇总和处理意见、措施(重点):。

篇2:客流数据异常分析报告

文中对存储装置采集的异常冲击波信号进行峰值压力提取.数据通过频谱分析后,采用凯泽窗滤波和平移压力基线的方法进行处理,有效滤除了自激振荡和高频噪声,对比同距测试点冲击波压力峰值,两者一致,有效提取了异常超压的.峰值压力.

作 者:尤文斌 丁永红 王宇龙 YOU Wenbin DING Yonghong WANG Yulong  作者单位:尤文斌,丁永红,YOU Wenbin,DING Yonghong(中北大学仪器科学与动态测试教育部重点实验室,太原,030051)

王宇龙,WANG Yulong(中国兵器工业软件工程及评测中心,北京,100089)

刊 名:弹箭与制导学报  PKU英文刊名:JOURNAL OF PROJECTILES, ROCKETS, MISSILES AND GUIDANCE 年,卷(期): 29(6) 分类号:O384 关键词:冲击波   存储测试   CPLD   blast wave   stored testing and measuring   CPLD  

篇3:客流数据异常分析报告

大数据时代, 企业的竞争优势从信息技术转变为围绕数据分析、流程管理、客户体验领域, 让数据发挥更大价值。当今商场作为一个以购物、娱乐、休闲、餐饮为主的商业组织形式, 更关注于集客能力、商品展示、客户服务、行销推广等方面, 这些需要精细化管理, 而精细化管理必须以事实为依据, 决策者、管理者通过对商场数据进行分析, 并用这些数据为顾客与商户服务。客流数据对商场来说是其核心元素, 充足有效的客流数据才能提升商场的盈利能力, 客流不仅是定位和招商的基础, 更是商场能否成功运营的关键[1]。通过人数以及顾客对商品是否购买这些量化数据, 研究流量规律, 滞留时间, 不但可以获得商场品牌连锁店铺正在运行的状况, 还可以利用这些数据进行有效的管理工作;通过深入的顾客研究, 可以增加销售机会, 最大限度地挖掘商场的销售潜力, 增加利润[2]。同时, 对于客流密度大的区域, 还能起到预警措施;对于新产品的上市受欢迎程度, 以及商场库存等更好的调控。

计算机软硬件的高速发展, 使得摄相探头已能够统计进出客流数量, POS机可以记录顾客购买了何种商品, 这为开发商场客流分析系统做好准备。通过分析这些摄相探头和POS机的数据, 可以为商场提供很多决策性依据。本文正是从此硬件基础上来对客流分析系统开发进行研究与实现。

2 系统设计思路

监控摄像机进行客流计数的方法如下:在几个出入口分别设置的几个摄像探头来专门统计人数, 这些摄像机都处在同一个横断面, 在中央处理系统内形成一个长方形监控框, 框内制作了前后两条线, 行人在穿这两条线时, 先过1线再过2线, 那就表示进, 商场增加一个顾客。反之也是一样, 先过2线再过1线就表示出, 减少一个顾客。电脑自动处理, 并每分钟实时将这些顾客进出时间、进还是出等数据存储于服务器中以备分析。同理, POS机的销售实时数据也一样每五分钟存储于服务器中, 这样, 就可以将这些数据通过计算机编程语言编写程序存储到关系数据库中, 然后再对数据库中的数据进行分析, 必要时采取数据挖掘算法。系统正是基于这样的思路进行设计。图1是就是基本流程设计图:

3 系统详细设计与实现

3.1 系统开发与运行环境

硬件环境:CPU Intel I3 3240 3.2G主频/内存4G/硬盘500G

软件配置:

●操作系统:Windows XP SP3

●开发工具与语言:Microsoft.NET2008/Visual C#

●数据库应用平台:MS SQL Server2005

●辅助控件:DXperience-10.1.5

●通讯机制:TCP/IP

3.2 系统设计和主要实现技术

摄像探头主要安装于商场进出口位置和商场内各店铺的进出口, 这样通过绑定摄相探头就可以得出整个商场或某店铺的进出数据, 这些数据以TXT格式存储于服务器硬盘中。POS机可以直接显示某间店铺的数据, 这些数据也是以TXT格式存储, 本系统首先要写程序将TXT格式的数据经过标识与转换后, 然后再存储于SQLSERVER2005数据库中。这个功能主要编写实时程序来实现, 此程序每隔5分钟会自动执行, 去读取过去5分钟内新存储于硬盘中的TXT格式文档, 然后进行标识与转换, 最后存储于数据库中。数据存储于数据库中, 基表字段比较简单, 都是每5分钟对应的INT数值, 表中的内容主要是五分钟的数据, 可以设计数据库视图来显示15分钟、30分钟、1小时和24小时的数据, 这样方便编写程序进行数据分析。

有了数据库中的数据, 就可以编写系统程序来进行数据分析了。DXperience Enterprise是一套完美的.NET用户界面控件套装, 它包含了Dev Express公司所有.NET控件产品 (包括Winforms和Web Forms) , 此控件用来分析数据和显示图表非常方便。使用Microsoft.NET2008工具结合DXperience-10.1.5控件进行开发, 本系统主要分为实时客流显示、分时客流显示、历史客流分析和销售数据分析四大功能模块。功能模块设计如图2所示, 系统用户界面如图3所示。

(1) 实时客流分析

实时客流查询可以查询当天的1小时、30分钟、15分钟、5分钟的实时客流, 包括来客人数, 离客人数和逗留人数, 查询对象:总店 (即整个商场) 、区域 (店铺) 、楼层、入口。客流以图表的形式显示。该模块主要使用DXperience的控件WebC hartC ontrol来进行开发与设计, 主要实现技术是SQL数据检索, 因为已经编写了可用视图, 使得系统开发更加容易。

(2) 分时客流分析

分时客流分析可以查询某一段日期时间或某节假日时间在每天每个小时、每30分钟、每15分钟的客流 (来客人数、离客人数、逗留人数) 情况, 查询对象同样有:总店 (即整个商场) 、区域 (店铺) 、楼层、入口。客流同样以图表的形式显示。该模块主要使用DXperience的控件ASPXWebC hartC ontrol与ASPXData Grid来进行开发与设计。ASPXData Grid控件显示所有数据, 其中还包括客流总和与平均数, 顾客平均逗留时间和最大逗留时间, 平均逗留时间和最大逗留时间这些数据主要可以分析顾客在商场或某店铺对商品的关注程度。

(3) 历史客流分析

历史客流分析可以查询某一段时间或某节假日时间的客流情况, 可以按时间段或按日期查询, 按时间段主要以1小时为区间范围, 同时客流是可以进行对比分析, 客流以图表的形式显示。此功能模块的实现技术与分时客流分析相同。

(4) 销售数据分析

销售数据分析分为实时销售数据查询和历史销售分析查询, 可以查询某一段时间或某节假日时间的销售情况, 其中包括销售成交数和成交总额、销售贡献率 (成交数/来客总数) 、商品关注度等。销售数据同样以图表的形式显示。此功能模块还用到了Apriori优化算法——基于频繁链表的频繁集的挖掘算法[3], 主要是利用Apriori算法发现频繁项集, 通过对频繁项集的分析来得出商场哪些产品是客户最喜欢关注和购买的。

4 小结

本文主要是对大数据时代商场客流分析系统的开发进行了研究, 设计了一个简单的客流分析系统。商场可以利用系统数据进行有效的管理工作, 通过对顾客的研究, 可以增加销售机会。对于自动识别客户属性, 发现各年龄段/性别的人数, 以及这些顾客对商品关注度等数据, 作者还要继续进行研究与探索。大数据时代, 商场对大数据的应用是无穷无尽的, 管理者只有不断的进行数据挖掘, 才能使商场的运营越来越好。

摘要:大数据时代, 详细的客流信息对于商场运营、决策、分析很重要。随着计算机软硬件的发展, 摄像探头已能够统计进出客流数量, POS机可以记录顾客购买了何种商品。以此两种硬件设备为基础, 文章对商场客流分析系统的开发进行了研究, 设计了一个客流分析系统。

关键词:大数据,商场,客流,系统

参考文献

[1]顾军华, 纪亮, 丁毅, 等.商场客流分析探讨及其应用研究[J].计算机应用与软件, 2008, 25 (7) :156-157, 223.

[2]钟晓鸣.运用商业智能, 提高零售企业竞争力[J].商场现代化, 2005 (24) :42-43.

篇4:客流数据异常分析报告

随着我国经济的飞速发展,人们的生活水平越来越高,人们的用电量日趋增加,供电企业的供电情况十分紧张,电量供不应求现象十分严重,这就导致用户电量异常的现象时有发生,从而间接使得供电企业和国家受到了严重的经济损失。因此,在普通电能表中不断引进新的科学技术是很有必要性的,这能扩大电能表的适用范围,提高了电能表的相关性能,能够检测出电量异常的情况,但是还是受到了技术的限制,具有一定的局限性。

虽然,利用电力负荷管理系统作为一种潜入用户内部的手段以实时检测用户的用电情况早已投入运行,但是根据近几年来的观察,这种方法在实际运行过程中,会或多或少的受到其相关环境、复杂的用电特性等诸多因素的影响,因此,电力负荷管理系统的可靠度不高,还是会存在误报、漏报的情况,从一定程度上来说,针对用户电量的异常情况,还是要投入一定的人力、物力以有效解决这个问题,减少这种现象发生的次数。

一、现场终端用电异常检测分析与处理

(一)用保护回路电量和计费电量比较

为实时检测用户的用电状况,并且和计量装置同步比较,我们在用户的配电室中串联电力负荷监控终端系统,这样就能实时并且准确地反映计费电量,然后,在电力负荷监控终端系统的另一端,接上一个保护回路或者其他不是计量回路的采集回路,这样就能对回路中的负荷和电量起到一定的保护作用。

在物理上来说,在用电负荷一定的情况下,用电量的绝对误差值来观察用电是否异常,但只有在用电负荷相对较小的时候,观察的结果才比较可靠,在实际使用过程中,往往电流互感器的精度比较低,因此,收集到的数据的差异较大,这就使得误警的情况时有发生,因此,要利用互感器倍率补偿法来弥补误差,消除不必要的误差干扰,这样一来,就能提高其准确度。

(二)表计信息异常

如今,智能电能表已经深得人心,得到了大大的推广和使用,它能对表计进行实时的管理和监控,也能检查出一些异常现象和普通故障,但是,智能电能表还是存在一定的缺陷的,首先,它是电子产品,其次,长久以来,智能电能表在运行过程中缺乏人员的监督,使得其存在很大的缺陷。然而,电力负荷管理系统则不同了,它能对电能表进行实时的检测盒监督,能够及时地发现电量异常现象并且将此反馈给中心站。

现在大多数的电能表都能灵敏地检测出失压、断相的情况,每间隔几分钟或者十几分钟便能够检测到相关事件并且对此进行记录,若发现这种现象发生的次数过多,该系统就会记录下这种事件并及时地反馈给中心站。如果回路中检测到的电量或者负荷与电能表上的记录数据不相符合的话,该系统也会实时的将此次事件反馈给中心站。另外,系统终端的时间应当和中心站一样,其中允许存在一定的误差,但如果误差过大的话,系统则会自动将该时间上报给中心站,中心站就会发出警告,并进行校验。

二、中心站电量数据异常分析与处理

以上所述的方法是适用于终端可以检测到保护回路的情况,而且在这种情况下,用户使用的是多功能电能表,但是,如果终端无法检测到保护回路,另外,用户使用的电能表也不是多功能电能表的话,就可以利用现场采集的數据通过中心站进行相关分析,以检测出一些电量异常现象。

(一)日用电量的比较

同期针对不同用户的用电数据进行分析,将每天采集的日用电量和同期取得的参考电量进行比较,并且针对那些同比下降的用户设置警告,可以设置多种方面的警告,也可以设置不同程度的警告,分几个等级,当然,也应当把一些突发、非人为的情况考虑在内,比如:意外停电。

(二)线损异常分析与处理

在电网配置的结构比较合乎常理的情况下,配电线路会由于线路质量、功率、负荷电流等因素的影响而发生一些正常损耗,并且在一定范围内波动。但是如果发生电量异常的情况,那么线路的毁损程度则会加大,因此,就要实时的监督线路的毁损情况,针对线路毁损情况,不必吹毛求疵,只要其毁损程度在一定范围内即可,则没有发生电量异常的情况。

(三)功率因数和无功功率因数分析与处理

在负荷一定或者无功功率的时候,设置功率因数变动的限值,一旦其数值超出正常值,就会对其发出警告,并且更换其表计的相序,错误的相序会让电能表少计甚至是不计电量。但是,这种情况还是存在一定的缺陷,如果负荷太小或者不用的话,这种情况下得到的数据结果是不可靠的,因此,这种情况要对电荷设置一定的门限。

三、总结

用电异常现象在我国还是比较严重的,在实际的过程中,供电企业应当根据其实际情况,不断完善该系统,排除不必要的干扰,提高该系统的精确度,让该系统更具有实践性。

参考文献

[1]李昕,李顺道,朱英.用户电量信息的后台分析与处理[J].上海电力,2010,02:164-166.

[2]黄晓东,麦卓成.浅谈电能量数据管理平台在农村台区降损增效中的应用[J].广东科技,2013,20:110-113+77.

[3]宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,04:927-935.

篇5:客流数据异常分析报告

1相关工作

通过异常数据的分析可以将入侵者的攻击流程直观的展示给人们。异常数据分析技术主要包括场景重构和报警融合。场景重构解决了传统入侵检测中存在着较高误报率和漏报率的问题,报警融合将大量的低级报警进行融合,确保攻击场景的完整性。Han等设计了基于关联规则的入侵检测算法,通过对频繁子集的挖掘,成功检测出了已知攻击的变种。赵宁等人提出了基于流程化攻击场景重构技术,采用不同的关联模型对来源不同的报警进行关联,重构入侵者的入侵场景。Daisuke提出了一种基于日志分析方法,通过对计算机网络日志进行分析,构建攻击者的攻击场景。H.Achi把计算机网络安全的一些技术应用到入侵检测,得出攻击者的网络攻击流程。

2异常数据分析方法

本文提出的基于场景重构和报警融合的异常数据分析方法,其主要思路是:首先去除攻击失败的报警;然后反向关联,减少场景重构中一些不必要的`数据;最后对一些孤立报警进行必要的补充,来保证场景图的完整性。对报警进行精简与合并,此项工作主要由以下两个步骤完成:对具有重复关系的报警进行合并;删除攻击失败的报警。通过寻找各个攻击步骤之间存在的因果关系,将那些大量的、离散的报警合并成同一攻击的不同攻击阶段。本文所使用的算法是在文章的基础上添加了时间约束条件,即两条报警能进行关联的前提是这两条报警的时间差在一定范围之内。对于某一个入侵场景,首先找到该场景中报警类型级别比较高且时间靠后的五条报警,就从这些报警开始向前补充,将这些报警补充完后,判断此场景是否完整,若该场景图还存在遗漏,需要再进行一次遗漏报警的补充,直至场景图相对最完整。

3实验结果及分析

上一节介绍了基于场景重构和报警融合的异常数据分析方法的具体流程,在本小节中,主要是将此方法得到的实验结果进行分析,验证本文所提出方法的必要性与可行性。1)报警融合步骤的必要性报警融合的主要目的是去除原始报警中冗余的报警,通过多次的实验,结果表明了在对报警信息进行关联分析时,必须要采取报警融合技术。2)基于异常数据进行入侵检测的可行性通过上面的实验,可以看出,通过报警融合确实减少了报警数量,但去掉的这些报警是否会影响场景图的完整性,下面对其进行分析。通过上图可以很清晰的看出攻击者的主要攻击步骤,即首先通过主机进行端口扫描,然后通过asp注入,添加超级用户,然后通过该用户对该网站进行操作管理,最后入侵网站成功。实际检测出的攻击场景图由图中虚线表示,即成功关联出了具有关联关系的报警信息,进行MSSQL注入时,会通过pangolin在主机增加一个用户,然后将此用户加入到管理员分组,提升此用户的权限,通过本文设计的系统进行关联时,将此步骤关联出来了。由此可以看出,本文的方法很大程度上避免了漏报,证明了该方法在可行性方面是没问题的。

4结论

篇6:客流调查分析统计报告

一 方案概述 ............................................... 4

(一)

(二)

(三)

(四)

(五) 客流统计应用环境 ........................................................................................... 4 客流在购物中心的作用 ................................................................................... 4 客流核心指标 .................................................................................................... 5 客流辅助指标 .................................................................................................... 6 如何选择客流系统 ........................................................................................... 6 二 技术原理与技术参数 ..................................... 10

(一) NEC客流统计产品介绍 ................................................................................10

1.1 系统概述 ........................................................................................................................10

1.2 技术领先优势 ................................................................................................................10

1.3 无可比拟的优势性――24H高精度! .....................................................................11 (二) SmartCount客流统计系统技术规格说明 ................................................11

2.1 系统组成 ........................................................................................................................11

2.2 客流一体机 VC-1010 .................................................................................................12

2.3系统技术参数 .................................................................................................................12

2.4一体机安装方式 .............................................................................................................13

2.5系统连接图 .....................................................................................................................14

2.6与其它产品的对比 ........................................................................................................14 (三) SmartCount后台报表系统 .........................................................................15

3.1报表功能列表 .................................................................................................................16

3.2报表架构设计 .................................................................................................................17

3.3报表展现内容 .................................................................................................................17

3.4报表样式列举(详见附件 1) ...................................................................................18 三 后台功能介绍 .......................................... 20

(一) 统一拓扑 ..........................................................................................................21

(三)

(四)

4.1

4.2

4.3

(五)

(六)

(七)

(八)

(九) 实时视频查看与调试 .....................................................................................22 用户管理与角色权限 .....................................................................................22 修改个人信息 ..................................................................................................22 管理员列表 ......................................................................................................23 添加管理员组 ..................................................................................................23 密码维护 ..........................................................................................................24 系统设置 ..........................................................................................................25 报警管理 ..........................................................................................................28 数据备份 ..........................................................................................................29 设备状态监控 ..................................................................................................30 四 客流分析应用介绍 ...................................... 30

(一)

(二)

(三)

(四) 掌握购物中心客流规律 .................................................................................31 定量把握营销活动的效查 .............................................................................32 营销促销效果 ..................................................................................................32 租户管理 ..........................................................................................................33 五

七 所需的软硬件环境 ...................................... 34 项目方案设计原则 ...................................... 34 系统开发、集成与实施、部署 ............................. 42

(一)

(二)

(三)

(四)

(五)

(六) 系统开发、设计 ..............................................................................................42 施工组织设计及项目管理机构、主要管理人员 .......................................42 系统工程实施 ..................................................................................................45 设备安装、调试 ..............................................................................................48 项目实施进度计划(可根据具体时间推移) .................................................53 系统验收 ..........................................................................................................54 八 培训及售后服务 ........................................ 54

(一)

(二)

(三) 售后服务内容总体说明 .................................................................................54 售后服务网络及流程 .....................................................................................54 售后服务标准 ..................................................................................................56

(五)

(六) 售后服务规范 ..................................................................................................59 培训 ..................................................................................................................62 九

十 质量管理体系 .......................................... 64 类似工程实施经验 ...................................... 67

(一)

(二)

(三)

(四) 国内部分案例清单 .........................................................................................67 上海来福士客流统计测试报告 .....................................................................68 北京地铁客流统计测试报告 .........................................................................69 全球客流案例 ..................................................................................................71

附件1:报表介绍 ............................................. 75 附件2:OPTION ........................................... 177

一 方案概述

当今IT技术以及大数据技术的应用,正在推动零售行业发生剧烈的变化。电商、社交媒体工具的兴起,使得曾经繁华的商场、百货大楼,等人们购物和社交的重要场所变得门可罗雀,甚至很多实体店面已经沦落为电商的展厅惨淡经营。所谓的“一铺养三代”变为过去,精细化营销及数据分析已经是作为实体店面不可或缺的手段。 作为商业设施的经营数据分析,主要是基于POS系统的销售数据、库存管理的商品数据以及CRM系统的客流数据这三方面的数据。随着数据分析的深入,客流数据已经不能仅仅是会员以及成交客人的数据,所有来店人员的数量以及来店人员的属性(性别、年龄)也纳入了分析的范围,从而也带动了客流数据采集技术及产品的需求。

(一) 客流统计应用环境

如何把握人数=实施对流动路线的控制

利用既有资料,参加到宣传、环境改善相关的咨询市场中来,以解决客流统计问题这一事业为基础,发展流动路线控制,市场营销等咨询事业。

(二) 客流在购物中心的作用

对于商业设施,以前的经营分析都是基于销售数据的分析,但是销售额是每一位来店顾客所创造的,所以在分析销售额的之前,针对来店顾客的分析是必不可少的。 在入口安装传感器,取得来店人数。

通过累计的历史数据,直观反映出该商业设施的集客能力.

分析环境对来店客人的影响

天气、季节、节假日、大型社会活动(奥林匹克、国际音乐节等等)

实施宣传活动效果评估

比较POS取得的购物客流量与来店客流量,并据此考虑宣传对策。

“前来购物,却空手而归”=>讨论进行怎样的宣传才能使顾客有购买欲 来店客人本来就很少=>讨论怎样提高知名度,如何吸引客人来店

・作为购物中心,来店者很多,所以要讨论建立怎样的休息场所

讨论如何延长客人在店内停留的时间

将天气、温度与来店客流量、销售的商品等联系起来,使“陈列应时、应季

产品”成为可能。

知晓客人的流动路线, 掌握客人常去的场所、店铺

消灭商场内死角:在“人迹罕至”的场所进行“猜谜游戏”、“印章收集角”、

‘特价促销’等活动。

依据客流量重新设定店铺的租金

购物中心的所有人导入系统,将客流量的信息资料贩售给各店铺的承租人。

=>在招揽承租人方面进行活用 or 店铺承租人在宣传中活用

与人脸认证相结合提供VIP认证、来客属性分析

在提高待客服务、顾客情报等环节提供VIP服务

导入与来店次数相关联的积分系统

连入电子看板,使之自动显示“XX先生/女士 欢迎莅临本店。(哪个服务员)恭候您的到来”或者安排专门客户经理接待客户。

缓和在POS机前等待的队列 =>有效地整理队列,使每条队伍长度趋向一

致,从而提高效率

分析客人经常聚集的场所及购物清单,为更好滴陈列商品、买进货物提供帮

助。

(三) 客流核心指标

进店客流量:

进入门店有效经营范围内的顾客数量。

一般来讲,越高越好

提袋率:

提袋率 = 成交笔数 / 进店客流量 * 100%

篇7:轨道交通客流分析论文

1.引言

城市轨道交通工程是城市一项百年大计的工程,因此必须要预知轨道交通未来年的客流规模,并对轨道交通工程规模充分预留,而不能仅仅是用来缓解现状的交通压力,因此客流预测就显得尤为重要。

毫无疑问,客流预测是城市轨道交通项目前期研究中最重要的专项,它决定了轨道交通设置规模、设施形式以及投融资等方方面面。然而,客流预测不像其它的研究专项,可以分析出对与错,它是对未来城市若干年后的预测,城市发展的复杂性和不确定性增加了客流预测的风险性。

目前,国内部分轨道交通方面的研究学者对客流预测并不重视(认为其技术性不高,误差很大),设计方案也往往根据其经验而定,然而,如此重要的专项研究太缺少我们的反思,到底客流预测为什么不准,是客流预测研究者出了问题,还是基础资料方面出了问题,或者还是我们的研究方法论(交通模型)出了问题。

2.国内外客流预测研究历程

2.1 国内外客流预测研究历程

1962 年美国芝加哥市发表的《Chicago Area Transportation Study》为标志,交通规划理论和方法得以诞生,并首次提出了四阶段预测理论。1962 年美国制订的联邦公路法规定凡 5万人口以上城市,必须制订以城市综合交通调查为基础的都市圈交通规划,方可得到联邦政府的公路建设财政补贴。

目前,欧美主要发达国家非常重视交通预测模型的建立与维护,部分地方政府甚至通过颁布地方法规的形式对交通预测模型的地位、重要性,以及交通模型师的收入等进行了规定,主要城市均已建立一套适合本地区的成熟的交通模型,随着城市发展不断稳定与成熟,预测精度逐步提高。

2.2 国内外客流预测研究对比分析

从国内外客流预测研究发展历程来看,国内外客流预测研究均有一个由简单、误差较大到一个逐步完善、成熟的交通预测体系发展趋势。

国外客流预测研究初期误差仍然较大,简单分析可以由以下几个方面的因素:

(1)城市发展较快,基础资料特别是城市规划以及相关政策仍然存在不确定性;

(2)交通预测理论尚不成熟,处于探索阶段;

(3)交通模型师对城市现状及未来客流发展趋势认识不足,对适合于本城市的交通模型参数修改及调整经验不足。

随着国外城市发展逐步稳定,城市规划的稳定,交通模型理论的成熟以及交通模型师的经验成熟均为客流预测带来了可信度,预测结果误差越来越小。这也给地方主管部门带来了信心,甚至出台相关政策规定交通规划以及交通设施建设研究阶段必须要使用交通模型。

3.客流预测的复杂性分析

从国内外客流预测发展历程来看,影响客流预测的因素主要可分为三个方面:客流预测基础资料、交通预测理论、交通模型师。三者组成客流预测复杂的系统,每一项都是影响客流预测精度的关键要素。

3.1 客流预测基础资料

客流预测基础资料是交通模型的输入源,很明显,如果把交通模型作为一个黑箱,那么如果输入源本身就有误差,那么客流预测结果也必然会产生误差。客流预测基础资料收集也相当复杂,主要分为四大类:

3.1.1 基础信息类

基础信息类主要包括城市人口、就业以及社会经济等方面的数据信息。基础信息类数据有助于交通模型师研判历史变化趋势,并对未来年作出合理预测。主要包括未来年就业率、时间价值等。

3.1.2 交通调查类

交通调查类主要包括居民出行调查、流动人口出行调查,城市对外出入调查等等,交通调查的目的,不仅仅可以用于分析现状城市的客流分布特征,以便于模型师判断城市未来客流发展特征及变化趋势,同时,有助于交通模型参数的标定,为建立适合本城市的交通模型。

3.1.3 城市规划类

城市规划类主要包括城市总体规划、综合交通规划以及专项规划等等,这些规划主要对城市未来年的发展规模,城市空间结构、基础设施分布及规模进行了详细的论证和规划。

应该说,城市规划类的相关资料对未来年的交通模型的建立发挥举足轻重的作用,其规划的稳定性以及合理、可信性非常关键,决定了对未来年预测结果的误差。举个简单的例子,规划一个新区未来人口是 50 万人,然而规划年仅仅容纳了 30 万,这样必然导致客流预测结果的误差。

3.2 客流预测理论

从国内外采用的预测方法来看,可以大致分为趋势外延法、吸引范围法和交通规划的四阶段法等三种形式(趋势外延法、吸引范围法、四阶段法)。

前两种方法仅考虑了轨道线路及其吸引范围内客流的变化,没有考虑轨道交通系统作为整个城市交通骨干建成后,将导致整个城市客流在城市路网上分布状态的变化。在客流预测研究初期采用较多,目前已经很少使用。

3.3 交通模型师

交通模型师不能游离于客流预测系统之外,因为他是交通数据分析、交通模型建立者,直接决定了客流预测的精度。事实上,不同的交通模型师,在同样的基础资料的前提条件下,客流预测结果必然会有差别,因此,交通模型师也是产生客流预测结果误差的主要原因。

4.客流预测的可控性分析

尽管客流预测系统非常复杂,涉及到方方面面,使得客流预测存在风险,存在不确定性,但是其风险是否可控值得进一步探讨。

在客流预测系统中,三大因素决定其客流预测精度,其中交通预测理论目前已经较为成熟,这方面的风险与误差是可以度量的,目前还没有更好的、更先进的预测理论出现。

因此,只要控制了输入端(基础资料)以及使用端(交通模型师)所带来的误差就能够较好地控制风险,事实上,这方面的风险是可控的。

在这里以南京地铁一号线南延线、二号线开通期客流预测为例说明风险的可控性。

5.结语

篇8:客流数据异常分析报告

近年来,我国旅游产业规模不断扩大,平遥古城作为中国境内保存最完整的古代县城与票号文化发源地,游客量快速增长,逐年增加的游客对古城承载力及景区建设提出了更高要求。与此同时,随着互联网技术的发展以及大数据时代的到来,旅游信息传播形式、游客信息搜索方式、旅游消费行为等均发生了巨大改变。许多旅游经营者、旅游企业及政府机构都通过互联网平台发布旅游信息,随之互联网平台也成为广大游客出游的重要信息来源,相应产生的网络搜索数据则逐渐成为高质量的游客旅游搜索行为数据库。2011年百度推出的百度指数可以直接、客观地反映某特定时间段内的社会热点、用户兴趣和需求,并且实证表明利用百度指数这一网络搜索指数进行预测克服了传统预测中存在的数据滞后以及数据量不足的缺陷,结果更为准确、更具时效性。因此,本文依托百度指数的时效性,挖掘旅游网络关注度和实际旅游需求的关系,预测景区客流量,对指导旅游管理部门做出科学、合理的决策安排,促进旅游可持续发展具有重要意义。

二、指标选取与数据

(一)指标选取

根据指标选取理论的分析可知,用户搜索行为反映了用户近期行为,但由于搜索用户的异质性,不同用户对某一事物的关注度有所不同,从而使得搜索关键词也具有多样性,且关键词应包含与目标事物相关的各个方面。因此,本文在已有文献基础上,根据相关旅游经验及人们外出旅行时的主要考虑因素,即衣、食、住、行、游5个方面,通过百度指数“趋势研究”和“需求图谱”两个模块来进行关键词的提取,这5个方面涵盖了平遥天气、平遥牛肉、平遥古城住宿、平遥古城门票、平遥古城旅游攻略等多方面信息。本文将这5个方面的相关词作为初始关键词,运用百度关键词挖掘进行关键词搜索,从而得到最终的关键词指标。

(二)数据说明

本文的关键词数据是利用网络爬虫技术从百度指数网页源代码中提取得到的。在利用初始词进行关键词搜索过程中,剔除没有数据对应和数据量很少的关键词,最终得到57个关键词从2011年12月到2014年12月共162周的数据。平遥古城旅游客流量数据来自山西省旅游局,选取的时间区间为2011年12月至2014年12月,共37个数据。由于我们得到的关键词数据为周度数据,而本文研究的是月度数据,所以要对关键词数据进行处理,将周度数据转化为月度数据,即按照日历中各月周数进行加总,将每月最后几天数据按所在周的天数作为权重,将该周的数据按权重分配到相邻月中,最终得到37个月的搜索指数数据。

三、实证分析

首先对模型拟合和预测有两点说明:一是拟合样本区间为2011年12月到2014年10月,共35个数据,用于预测检验的样本区间为2014年的11月到12月2个月的数据。二是在模型拟合效果的比较上,本文引入MSE和NMSE两个指标,分别代表模型的稳定性和拟合度。

(一)搜索关键词确定

首先,利用简单手动筛选,观察所有关键词数据,将趋势变化不明显或几乎无变化趋势的剔除;然后,利用Pearson相关系数筛选,分别计算各关键词与因变量的Pearson相关系数,将相关系数小于0.6的剔除;最后,利用线性回归筛选,并诊断回归的多重共线性和自相关,利用逐步回归及AIC准则选出最终的4个关键词:平遥古城旅游攻略、平遥古城地图、山西旅游景点大全、平遥住宿。

(二)模型估计

在筛选关键词过程中,我们构建了一个线性回归方程,回归估计如下:

从回归结果看,总体拟合效果较好,变量系数均通过显著性检验,因此该线性模型似乎具有较好预测效果。但为进一步考察模型假设是否成立,我们进行残差的Shapiro-Wilk正态性检验,并且刻画了因变量直方图及对应的线性分布图,检验结果均表明因变量不服从正态分布,因此本文利用线性回归进行模型模拟时并不能满足其对因变量分布的假定,从而会产生较大误差,影响拟合和预测效果。

故本文采用了对数据分布没有任何假定且结果可用交叉验证方法来评判的四种机器学习方法进行模型拟合及预测,并比较了决策树、bgging、随机森林、支持向量机这四种算法模型的拟合度、稳定性与预测效果。

(三)模型结果分析

使用以上四种算法估计模型,计算出各模型的MSE和NMSE,结果见表1。

从模型的拟合度和稳定性来看,回归树和Bagging都存在明显不足,其MSE和NMSE值均大于另外两个模型,回归树模型在所有模型中拟合效果最差。而随机森林和支持向量机(SVM)这两种模型的效果较好,其中随机森林的拟合度和稳定性最佳,SVM模型的拟合度较好,但模型稳定性不佳。最后分别用以上算法模型对样本期外两个月的客流量进行预测,并将其与真实值对比,计算其平均误差率,结果见表2。

如表2所示,模型拟合效果较差的回归树和bagging的预测效果仍不理想,平均误差率分别达到了11.55%和7.18%,与真实客流量数据相比存在较大偏差。同时,拟合效果最佳的随机森林预测效果并不理想,其平均误差率达8.54%,甚至差于bagging。而SVM模型的平均误差率仅有1.46%,具有较好的预测效果。分析原因,笔者认为可能是由于bagging、回归树、随机森林三种算法模型的分类原理本质上源于归纳算法,这类模型在结构复杂的数据集上学习能力和适应性不够强,有效性和伸缩性不足,而SVM则采取了与传统模型不同的思想,具有较强的泛化能力,所以预测结果与实际较为接近。

四、结论

本文在分析旅游客流量和百度搜索指数关系的基础上,运用一系列方法筛选出与旅游客流量相关性最高的四个关键词,并运用回归树、bagging、随机森林和SVM四种机器学习算法模型对客流量数据进行了拟合和预测。研究具体结论主要有三点,一是主要或潜在游客主要通过对“平遥古城旅游攻略”、“平遥古城地图”、“山西旅游景点大全”、“平遥住宿”等关键词的搜索来获取平遥古城旅游信息。二是回归树、bagging、随机森林和SVM模型中,拟合效果最好的是随机森林和SVM模型,稳定性最好的为随机森林模型,回归树、bagging的拟合度和稳定性都较差;预测效果最好的为SVM。因此,综合拟合度、稳定性和预测效果可知,SVM模型的整体效果最好,可以作为最终的平遥古城旅游客流量预测模型。三是利用关键词的百度指数来对平遥古城旅游客流量进行预测,可以在每月月底得到较为准确的数据,这比相关部门公布的数据提前了15天左右,具有较高的时效性。

摘要:本文基于百度指数进行旅游关键词的挖掘,运用决策树、bagging、随机森林和支持向量机四种算法模型对旅游关键词与平遥古城游客流量关系进行分析,并比较了各模型的拟合度、稳定性及预测效果。实证研究发现,随机森林模型稳定性最好,SVM模型拟合和预测效果最好,因此SVM模型可以作为最终的平遥古城客流量预测模型。

关键词:平遥古城,百度指数,机器学习,预测

参考文献

[1]Choi H,Varian H.Predicting the Present with Google Trends[J].Economic Record,2009,88(s1):2-9.

[2]黄先开,张丽峰.百度指数与旅游景区游客量的关系及预测研究——以北京故宫为例[J].旅游学刊,2013,28(11):93-100.

上一篇:莫使记忆宝玉蒙尘作文800字下一篇:广播比赛优秀作文