神经网络网络舆情论文

2022-04-20

〔摘要〕首先通过主成分分析消除原始指标之间的相关性,使指标数量变少且相互之间不相关,从而构建综合预判指标,再利用BP神经网络建立微博舆情预判模型。实验选取2013年微博热门话题作为训练样本,选取2014年的话题作为预测。实验结果表明,主成分分析有助于去除原始样本数据的冗余,简化了网络的复杂度,所得到的结果更加准确。下面是小编整理的《神经网络网络舆情论文(精选3篇)》的相关内容,希望能给你带来帮助!

神经网络网络舆情论文 篇1:

利用BP神经网络对网络舆情进行预警

摘要:随着近年来中国网民数量众多而网络给予了众多网民言论自由,因此网络舆情越来越被关注,对网络舆情的预警也越来越迫切。该文采用了五个指标对“厦门PX事件”、“昆明PX事件”和“宁波PX事件”进行量化描述,通过Matlab建立BP神经网络识别模型中进行学习,然后再对“宁波PX事件”进行预警识别。模型具有较好的识别能力,预警结果的准确率达到了90%以上。

关键词:网络舆情;BP神经网络;预警

互联网这些年来在我国的快速的发展,我国网民人数较之前有了大幅的提升。网络的开放性和灵活性让其成为反映社会舆情的主要载体之一。而近两三年网络舆情引发的事件激增,引起了政府的高度重视,网络俨然已成为政府部门了解民意的又一理想窗口。显然,能够直观表达网络舆情的光定性的解读远远不够,对于决策者更希望得到一个舆论事件过程中所处的量化等级。由于舆情危机产生具有模糊性和随机性是非线性的,因此通过建立预警指标,再利用容错能力高,通过学习复杂数据发现规律进行识别的人工神经网络是不二选择。故本文的核心在于BP神经网络[1]。

1 网络舆情危机预警指标体系

网络舆情危机的发生,受到多种随机因素的影响,而且每个因素对结果所起的效果大小也是不一样的。因此网络舆情危机预警的关键是建立科学、系统的预警指标体系。依据近些年来网络舆情方面专家的调查汇总和政府机构对舆情监督部门的考察,并结合网络舆情与危机预警机制方面的资料,经过多次地调试整理汇总制定出,对网络舆情信息从五个具体的指标构建了网络舆情危机预警指标体系[2]。

1.1 舆情预警指标

1.1.1 舆情信息的敏感度

网络上有各式各样的信息,而这些各式各样的信息其敏感度也是不同的,对于可能造成社会动荡的网络信息则是政府最为关注的。显然各条信息所引起的社会敏感度是不同的,敏感度越高说明产生舆论危机的可能性就越高。这种指标的量化标准采用专家打分的方法得到。得分设定的范围为[0,1],0、0.5、0.7、1表示的意义依次为“具有敏感性”、“敏感”、“很敏感”、“相当敏感”。

1.1.2 舆情信息的流通量

舆情信息的流通量反映出舆情信息在网络上传播情况和讨论热度。而这些网络上的流通信息会被搜索引擎例如Google、百度等抓取。因此通过限定时间段搜索引擎搜索关键词得到的搜索量可以作为流通量使用。

1.2.3 舆情观点倾向度

舆情观点倾向度主要量化网民对于某个舆论信息观点倾向度。分别由1,0,-1表示正面、中立、反面观点,用[f(x)][f(x)]表示各个观点面倾向度,n表示发表观点的总观点数,此指标用[μ]表示:

其实就是求各个观点总和的均值,其取值范围在(-1,1)。这部分则是通过统计事件讨论最热的贴吧的跟帖信息或者微博评论进行打分得到的。

1.2.4 舆情影响范围

舆情影响范围是指在某一时刻或时间段内,舆情信息所影响的区域性范围。对于这部分的评分依照我国的行政地域划分进行评分。即村\社区、乡\镇\街道、县\区、市、省、国家。其取值范围为[0,1]。这部分的取值则是通过新闻报道中时间的发展态势进行取值。地域对应的取值见下表:

1.2.5 网络舆情媒体曝光度

网络舆情信息被媒体曝光之后则将网络信息的讨论引到现实社会中,而现实中媒体的报道是有着比网络更为严格的审查制度。媒体的报道无疑对网络舆情有着更为影响力的宣传进而推动着舆论的发展。而这部分的数据则采用Google news中通过对时间段的设定搜索关键词得到相应的搜索到的新闻条数进行量化评价媒体的曝光度。

1.2.6 舆情指标

而结果评级依照《国家突发公共事件总体应急预案》将预警等级设为四个等级:特别严重、严重、较重和一般。而根据网络舆情危机的严重程度、经济程度、可控性等方面将预警设为5个等级:安全、轻警、中警、重警、急警[7]。

2 数据获取与处理

2.1 事件的选取和回顾

在实证分析中以“宁波PX事件”为预警模型的最终目标,而选择了“厦门PX事件”和“昆明PX事件”为学习样本进行学习。这一连串关于PX事件其危害的对象不仅仅是政府形象更是对整个社会和谐稳定造成了较大的影响。尤其是宁波PX事件中,甚至出现了不理智的因受谣言的蛊惑冲击政府机关掀翻执勤警车的情况。倘若能及时且准确地对此类事件进行预警并作出相应的预防措施就能对事件进行有效的控制。

2.2 指标数据的获取

对于所建立的模型而言其关键不仅仅在于预警模型的指标的建立和神经网络的识别。其数据的获取亦是十分关键的一步。根据各个数据的特点,整理各个指标数据获取方式如下。

将厦门PX事件和昆明PX事件作为一个学习样本,其数据清单如表3所示。

同样将模型的预警目标——“宁波PX事件”作为目标数据,其数据清单如表4所示。

2.3 输入数据的标准化处理

网络舆情危机预警指标体系中有5个预警指标,其中存在定性指标和定量指标两大类,并且对各个指标的数据进行了量化处理,然而各个指标的单位的量纲是不同的,为了能够对各个指标进行对比评分 ,需要将它们进行标准化得到[0,1]无量纲指标。

量化的指标均有正负方向均有正负方向之分,自然这些数据的标注化方法均有不同:

1)正向指标处理:正向指标表示值越大越安全,危机等级越小无量纲化以最小值为基准,正向无量纲化处理方程:

2) 负向指标处理:负向指标在文章中表示指标值越小越安全,危机等级越小。无量纲化以最大值为基准,负向的无量纲化处理方程:

其中,X 表示量化后的指标值, [xmin]表示指标的最小值, [xi] 表示指标的实际值, [xmax]表示指标的最大值。

3 舆情预警模型的建立及结果

3.1 模型的建立

神经网络模型是一个典型的“输入-处理-输出”的过程。输入是采集到的指标的实际值,输出是模型识别的结果,即预警的敏感度,而中间过称则采用BP神经网络模型进行学习计算,这部分相当于“黑匣子”。在处理的时候,该文采用三层BP网络(一个输入层、一个隐含层、一个输出层)的网络结构,那么输入、输出节点数分别是5和1[8]。

在设置完参数之后用第四章所讲述的利用Matlab软件完成模型的建立。

3.2 结果及检验

通过搜集得到的数据汇编成的学习样本,并将其中的70%作为样本,30%作为检验样本进行。

通过计算可以得到该表,从该表中容易得到,学习过程中准确率达到了91.76%。并在测过程中抽取了5项进行预测,得到的准确率为92.31%,其较高的准确率。因此有理由认为该模型在未来的预测过程中其准确率应该达到90%以上。

4 研究结论

本文的研究结果表明:基于舆情量化指标的BP神经网络能够对网络舆情信息进行较为准确的预警,无论是学习还是最后实践的识别准确率都达到了80%以上。这种预警方法通过舆情信息的预警指标利用量化评价方法可以降低人为的主管臆断,而实验结果也表明了其拥有较高的识别准确率。并且利用Matlab进行编程得到的预警模型具有广泛的应用前景和使用价值。模型可以为政府提供网络舆情的预警,也为企业的网络声誉进行预警为企业的公关提供预警参考。

参考文献:

[1] 薛圈圈.基于BP神经网络的网络舆情危机预警研究[D].江西:江西财经大学,2010:25-30.

[2] 戴媛.我国网络舆情安全评估指标体系研究[D].北京:北京化工大学,2008:13-22.

[3] 袁越.厦门PX时间[OL].http://news.sina.com.cn/c/2007-09-27/165713986641.shtml.

[4] 王秀娟.昆明PX事件[N].中国石油石化,2013.

[5] 大公网.镇海PX项目引发群体性事件[OL].http://www.takungpao.com/mainland/node_13226.htm.

[6] 周子健.基于网络搜索量的上海世博会国际影响力研究[J].艺海,2011(5):80-82.

[7] 王新辉.基于BP神经网络的国际电子商务信用风险预警模型研究[D].沈阳:沈阳工业大学,2008:7-14.

[8] 杨淑娥,黄礼.基于BP神经网络的上市公司财务预警模型.系统工程理论与实践[J].2005(1):21-26.

作者:陈乐朋 周家政

神经网络网络舆情论文 篇2:

主成分分析与BP神经网络在微博舆情预判中的应用

〔摘要〕首先通过主成分分析消除原始指标之间的相关性,使指标数量变少且相互之间不相关,从而构建综合预判指标,再利用BP神经网络建立微博舆情预判模型。实验选取2013年微博热门话题作为训练样本,选取2014年的话题作为预测。实验结果表明,主成分分析有助于去除原始样本数据的冗余,简化了网络的复杂度,所得到的结果更加准确。因此,该模型较仅使用BP神经网络的准确性更高。

〔关键词〕主成分分析;BP神经网络;微博舆情;预判模型

DOI:10.3969/j.issn.1008-0821.2016.07.011

针对舆情的研究,国外起步较早,从19世纪中期初级发展,到20世纪中期已经走向成熟[1]。在我国,专门针对舆情的研究,大致始于2004年,党的十六届四中全会提出:“建立舆情汇集和分析机制,畅通社情民意反映渠道”后,“舆情”这一词才逐渐被社会各界所熟悉并使用,此后在我国成立了有关舆情的研究中心。

目前我国针对舆情分析指标的研究有很多,如曾润喜等在建立网络舆情分级预警机制的基础上,构建了警源、警兆、警情3类指标体系[2]。高承实等结合信息空间模型构建了微博舆情的三维空间,建立了社会类指标与技术类指标、舆情主体与舆情受众之间的关系[3]。方洁等从利益相关者的视角出发,结合信息空间模型分析微博舆情传播的过程,构建微博舆情监测指标[4]。王长宁等分析微博舆情的传播特点,在此基础上建立微博舆情预警体系[5]。也有众多学者针对预警模型进行研究,如张华采用离散的时间序列描述微博舆情的趋势,对微博文本中的热点话题进行提取、分析并对微博舆情进行预测[6]。曹帅等建立了微博舆情发展趋势的直线修正模型,阐释了移动平均法能够初步分析微博舆情的发展趋势并对其进行了预测[7]。张金伟等建立了一种基于性格、心情和情感空间的多层次心理预警模型,有效地实现了对微博情感的分析和描述[8]。邱智伟等对各维度包含的指标与微博舆情进行相关性检验,经回归分析构建舆情微博数预测方程式,通过舆情微博数的增减确定微博舆情的涨落,从而构建微博舆情预警模型[9]。林琛设计了包含网络舆情监测指标、网络舆情评估指标与网络舆情预警指标的三层网络舆情指标体系[10]。

此外还有许多针对微博舆情的研究,例如李天龙等引入系统研究方法,界定了微博舆情生成机制[11]。张亚明等结合基于Vague集的AHP评估方法对舆情进行实证分析[12]。唐晓波提出用依存句法分析来改进传统文本相似矩阵,以提高微博数据聚类准确性[13]。王洪亮等同时从情报学和传染病学的角度来研究突发自然灾害事件微博舆情蔓延特征[14]。高承实等结合信息空间模型构建了微博舆情的三维空间,运用层次分析法,建立了微博舆情监测指标体系[15]。

建立科学的微博监测指标是进行舆情预判的前提。虽然针对微博监测指标的研究已有很多,但是许多学者的研究只涉及到了定性的层面,而没有更深入的进行定量分析。也有一些学者涉及到了定量的研究,但是研究所得到的指标难以获取,导致很难进行预判监控;并且得到的定量的指标之间可能还会存在着一定的相关性,导致预判监控的结果准确率不够高。

71主成分分析与BP神经网络模型的建立

本研究尝试建立基于主成分分析与BP神经网络的微博网络社群突发舆情预判模型,通过主成分分析消除指标之间的相关性,再利用BP神经网络人工智能的特点,通过最速下降法的学习,输出话题等级。主成分分析使指标数量变少且相互之间不相关,再利用BP神经网络强大的非线性映射,有效处理这些内部机制复杂的舆情管控问题。研究以期帮助相关部门及时了解微博的舆情,有助于其对正面信息加大力度传播,对负面信息加以预警,从而保障群众对相关部门的信任与支持,利于国家和谐稳定可持续的发展[16]。

BP(Back Propagation)神经网络,即误差反传误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各节点接收输入信息,并传递给隐含层各节点;隐含层负责信息变换,考虑到增加隐含层的节点数比增加隐含层的层数更便于计算,不会使网络太过于复杂化,因此本文的隐含层为单隐层结构;隐含层传递信息到输出层各节点,完成一次信息的正向传播。当实际输出与期望输出不符时,误差通过输出层,按误差梯度下降的方式修正各层权值,向隐含层、输入层逐层反传。信息正向传播和误差反向传播的交替进行,使各层权值不断调整,一直到网络输出的误差减少到可以接受的范围或者预先设定的学习次数为止[17]。

本研究采用主成分分析构建微博网络舆情预判指标体系,尽可能多的考虑对预判结果有影响的指标。可是涉及的多个指标之间可能会存在一定的相关性,比如说:活跃粉丝多的微博用户可能发出一条微博会有很多的评论量。因此找出几个为原来指标的线性组合的综合指标就显得很重要了。综合指标有以下几个特点:(1)综合指标是原始指标的线性组合,因此保留了原始指标的主要信息;(2)彼此之间不相关;(3)比原始指标具有某些优越性质。这使得在研究指标体系时更加容易[18]。

通过主成分分析可以消除指标之间的相关性,用原始指标的线性组合形成的相互之间不相关的综合指标来代替原始指标,选取特征值大于1并且原始指标的大部分信息可被解释的若干个综合指标,此时得到的综合指标的数量会少于原始指标,从而减少指标,去除原始样本数据的冗余,利于数据的整理与计算;再利用BP神经网络,分别用原始指标和综合指标作为输入,通过数据流的正向传输和反向传输两个过程的交替进行,分别输出话题等级,比较两种输入所得到的输出结果[18]。所建立的综合模型见图1。图1主成分分析与BP神经网络模型

2主成分分析法与BP神经网络的结合应用

21话题表

由于该类问题没有Benchmark算例,此处选取的训练样本与预测样本仅为说明模型使用过程,具体如下:根据新浪微博数据中心提供的2013年1月-2013年12月微博热门话题盘点及新浪微博2013年热门事件话题大盘点,选取2013年十大热点话题为预警度最高的Ⅰ级(特别严重),在各月中排在前面但没在十大话题出现的作为Ⅱ级(严重),在各月中排在中间位置的作为Ⅲ级(较重),在各月中排名相对较后的作为Ⅳ级(一般),训练话题表如表1所示。以同样的方法选取2014年的话题作为预测,预测话题表如表2所示。

22对数据进行主成分分析

微博热度由广播数x1、收听数x2、听众数x3、平均转播数 and 平均评论数x4、听众的平均收听人数x5、听众的平均听众人数x6、听众的平均等级x7、收听人的平均收听人数x8、收听人的平均听众人数x9、收听人的平均等级x10、手机达人x11、QQ会员x12、转播达人x13、天下无双x14、微博劳模x15、青春正能量x16、秒微创意x17、事实派x18、微生活x19、微爱校园行x20、投票达人x21、礼物达人x22、新鲜达人x23、热心达人x24、奇吃妙享x25、评论达人x26、点赞狂魔x27、心情签到达人x28、动感勋章x29、新星主播x30、沙发王x31、蒲公英印记x32这32个原始指标组成。随机选取324个名人,获取上述数据。经过主成分分析处理之后得到综合指标X1、X2、X3、X4、X5、X6,这6个综合指标能概括32个原始指标7781%的信息,达到了降低复杂度的同时尽量保留大部分信息的目的。

23建立BP神经网络模型

以话题为关键词,获取该话题转发量最多的10位名人的32个原始指标(其中有些指标是该话题所特有的,比如:平均转播数 and 平均评论数;还有一些指标是该名人所特有的,比如:广播数、收听数),分别计算32个原始指标的平均值作为该关键词的相应原始指标。

(1)直接用32个原始指标x1、x2…x32作为BP神经网络的输入数据。以训练样本话题的数据为样本对BP神经网络进行训练,然后用预测样本的数据进行输入,比较输出结果与真实结果。

(2)32个原始指标先根据主成分分析得到的公式算出6个综合指标,再把得到的6个综合指标X1、X2、X3、X4、X5、X6作为BP神经网络的输入数据,经过训练学习后把输出结果与真实结果进行比较。

两种方法的运行结果对比如图2所示。

24结果分析

为了使结果看起来更直观。将准确率分为一级准确率、二级准确率、三级准确率、四级准确率。其中,一级准确率:输出结果与真实结果相同的话题数/总话题数;二级准确率:输出结果与真实结果相差一个等级(例:真实结果为Ⅰ级预警,而预测结果为Ⅱ级预警,反过来亦然)的话题数/总话题数;三级准确率:输出结果与真实结果相差两个等级(例:真实结果为Ⅰ级预警,而预测结果为Ⅲ级预警)的话题数/总话题数;四级准确率:输出结果与真实结果相差3个等级(例:真实结果为Ⅰ级预警,而预测结果为Ⅳ级预警)的话题数/总话题数。根据定义,计算出两种方法所得结果的准确率:法一得到的一级准确率为22/40=55%,二级准确率为11/40=275%,三级准确率为4/40=10%,四级准确率为3/40=75%。而法二得到的输出结果一级准确率为35/40=875%,二级准确率为2/40=5%,三级准确率为1/40=25%,四级准确率为2/40=5%。由此可以得到,经过主成分分析后预警结果的一级准确率比没有进行主成分分析提高了325%;而误差比较明显的三级准确率和四级准确率比没有进行主成分分析降低了10%。发图2运行结果对比图

现因为主成分分析有助于去除原始样本数据的冗余,简化了网络的复杂度,所以所得到的结果更加准确。

另一方面,方法一训练时间为1秒,进行了235次迭代,错误率为0308。方法二训练时间为1秒,进行了297次迭代,错误率为185*10^(5)。虽然训练时间与迭代次数都差不多,可是误差却是几个数量级的区别。可见简化网络的复杂度可以在同样的时间内进行更加有效的学习。

由此可以得出,为了实验的准确性,需要获取尽可能多的原始数据,可是过多的原始数据之间不可避免的可能会有一定的相关性,这就导致了矛盾的存在。而采用主成分分析的方法,可以有效的减少这种矛盾,使结果更加准确。

3结语

本研究结合主成分分析与BP神经网络来构建微博网络社群突发舆情危机预判模型,通过实例来验证模型的准确性。此模型较仅使用BP神经网络的准确性更高。此外,该模型也会存在着一些缺点。首先是进行主成分分析的324位名人是随机选取的,在此进行改进(如把名人细分:体育类、新闻类、综艺类等)并增加名人的数量,预判结果的准确性可能会有所增长。其次是以话题为关键词获取原始指标时为了获取的方便,是以转发量为考虑对象的,而没有充分结合所有方面进行考虑,且获取的名人数量不够多。再次此刻获取2013年某个关键词的数据,获取到的是当前的数据,用当前数据的值来分析2013年的情况,不可避免的存在一定的误差。最后也存在BP神经网络固有的缺点,就是容易陷入局部极小值点,结果也会根据隐含层的元素个数而改变。

该模型的预判结果的准确性将随着原始指标的合理性、训练集数量的增加而增长。研究所得到的结果可以为舆情的管理提供有效的指导。

参考文献

[1]艾新革.国内外舆情研究述略[J].图书馆学刊,2011,(9):140-142.

[2]曾润喜.网络舆情突发事件预警指标体系构建[J].情报理论与实践,2010,(1):77-80.

[3]高承实,荣星,陈越.微博舆情监测指标体系研究[J].情报杂志,2011,(9):66-70.

[4]方洁,龚立群,魏疆.基于利益相关者理论的微博舆情中的用户分类研究[J].情报科学,2014,(1):18-22.

[5]王长宁,陈维勤,许浩.对微博舆情热度监测及预警的指标体系的研究[J].计算机与现代化,2013,(1):126-129.

[6]张华.基于优化BP神经网络的微博舆情预测模型研究[D].武汉:华中师范大学,2014.

[7]曹帅,兰月新,苏国强,等.基于移动平均法的微博舆情预测模型研究[J].湖北警官学院学报,2014,(3):40-42.

[8]张金伟,刘晓平.基于心理预警模型的微博情感识别研究[J].合肥工业大学学报:自然科学版,2013,(11):1318-1322.

[9]邱智伟.基于混沌理论的微博舆情预警模型研究[D].广州:华南理工大学,2015.

[10]林琛.基于网络舆论形成过程的舆情指标体系构建研究[J].情报科学,2015,(1):146-149.

[11]李天龙,李明德,张宏邦.微博舆情生成机制研究[J].情报杂志,2014,(9):117-122.

[12]张亚明,刘婉莹,刘海鸥.基于Vague集的微博舆情评估体系研究[J].情报杂志,2014,(4):84-89.

[13]唐晓波,肖璐.基于依存句法分析的微博主题挖掘模型研究[J].情报科学,2015,(9):61-65.

[14]王洪亮,周海炜.突发自然灾害事件微博舆情蔓延规律与控制研究[J].情报杂志,2013,(9):23-28.

[15]高承实,荣星,陈越.微博舆情监测指标体系研究[J].情报杂志,2011,(9):66-70.

[16]潘芳,张霞,仲伟俊.基于BP神经网络的微博网络社群突发舆情的预警监控[J].情报杂志,2014,(5):125-128.

[17]杨淑娥,黄礼.基于BP神经网络的上市公司财务预警模型[J].系统工程理论与实践,2005,(1):12-18.

[18]陈建宏,刘浪,周智勇,等.基于主成分分析与神经网络的采矿方法优选[J].中南大学学报:自然科学版,2010,(5):1967-1972.

(本文责任编辑:郭沫含)

作者:饶浩 陈海媚

神经网络网络舆情论文 篇3:

CNN算法改进及在舆情分析中的应用

摘  要:作为深度学习图像识别的开创性复杂算法,卷积神经网络(CNN)在图像处理中有着其他机器学习算法所不具备的高精度的优点,同时小波神经网络(WNN)在训练中有着跳出局部极小值的特点,因此可达到的最小误差精度是大部分网络难以达到的。结合CNN与WNN各自的优点,本文提出了CNN与WNN相结合的两种网络:小波卷积小波神经网络(wCwNN)和小波卷积神经网络(wCNN)。基于wCwNN网络以及wCNN网络对文本分析问题进行探索,尝试用两种网络处理经由词向量模型(word2vec)处理后的文本信息,发现相比于传统的卷积神经网络,针对经word2vec处理后的文本,改进后的网络仍然具有一定的优勢。本文最后针对经典的神经网络对处理文本类数据问题提出研究方向,并对神经网络未来发展提出想法。

关键词:wCwNN;WNN;CNN;word2vec;文本分析

Improvement of CNN Algorithm and Its Application in Public Opinion Analysis

ZUO Fangling,GUO Yingxiao

(School of Information,Capital University of Economics and Business,Beijing  100070,China)

0  引  言

随着互联网的发展,解读社交网络信息成为了舆情处理的重要方向,但是面对各种复杂的数据形式,传统的数据分析算法已经无法从数据中提炼较为准确的信息。

我国对舆情监控较为重视,但是定量分析还未成熟。因此,本文希望更好地对网络舆情进行即时处理、即时反馈,利用传统神经网络独特的特征提取优势,再加以改进,进一步提升舆情处理的即时性。

1  研究主要内容

本文针对现阶段的微博情感分析,更改CNN结构:模仿CNN的结构分析WNN,利用BP反向传播的基本机制推导WNN公式,利用WNN替换CNN的全连接层与卷积池化层,改进CNN极易陷入局部最优的特性。提出小波卷积小波神经网络(下文简称wCwNN)和小波卷积神经网络(下文简称wCNN)。

2  研究方法实践

2.1  各神经网络算法对比分析

2.1.1  卷积神经网络

标准的卷积神经网络训练过程由前馈计算(Forward-Feedback)和反向传播(Back-Propagation)组成,调整参数则采用了经典的梯度下降法(Gradient Descent)进行计算。以LeNet-5为模板,标准的网络拓扑结构有以下几个部分:输入层(Input layer)、卷积层(Convolution layer)、池化层(Pooling layer)、全连接层(Fully-connected layer),输出层(Output layer)。

2.1.2  小波卷积神经网络

小波神经网络(WNN)是由多组小波变换充当隐含层神经元并与传统的输入层神经元与输出层神经元所构成,通过遗传算法确定隐含层的神经元个数。

2.1.3  小波卷积小波神经网络

小波卷积小波神经网络(wCwNN网络)分为前段网络和后段网络,前段网络为卷积池化网络,其中卷积层的激活函数为小波尺度变换函数,后段网络为小波神经网络。

2.1.4  实验设计

实验对象为CNN、wCwNN、wCNN,实验分为两部分:一部分為对于每一种网络,不设置训练次数上限,不设置训练误差下限,观察每一种网络能达到的最小误差;另一部分为对于每一种网络,不设置训练次数上限,设置所有网络都能达到的训练误差下限,观察各网络能达到误差下限时所用的时间。用同一组数据作为输入计算各神经网络的运行时间的平均值、最小值和最大值,最小均方误差的平均值、最小值和最大值。可得如下结论:

(1)改进后的wCwNN与wCNN网络较原始CNN网络性能有所提高。

(2)wCwNN网络具有较快的收敛速度与达到极小误差精度的能力。

(3)wCNN网络具有极快的收敛速度与达到较小误差精度的能力。

(4)相比于wCNN网络,wCwNN网络训练过程中误差波动较大,也就是说该网络具备跳出局部极小值的能力,因此在一定实验次数下,wCwNN网络能达到的最小误差比wCNN网络要小。该种类型的网络适用于对最小精度有要求的实际场景中。

(5)相比于wCwNN网络,wCNN网络在每一次仿真中都保持较为稳定的误差下降过程,因此15次仿真的最小误差值与最大误差值相差不大(实验一可达性实验)。同时,当控制各网络目标误差相等时(实验二训练时间对比实验),wCNN网络具备误差快速收敛的能力。该种类型的网络适用于对训练时间有要求的实际场景中。

2.2  基于wCwNN与wCNN的文本分析

2.2.1  数据获取

将数据源分为两类:一类为公开数据集中现有的微博评论数据,作为训练和验证数据;一类是从网页版微博中实时爬取的微博数据,作为测试数据。其中现有的微博评论数据量为120000,实时爬取的微博数据量为124,两份数据均以CSV格式存放在Excel表中。

2.2.2  数据预处理

数据预处理阶段分为数据清洗与文本词向量化:数据清洗指对原始数据进行基本的处理以满足数据分析的要求,本例中的数据清洗包括删除重复数据、去除评论信息为空的数据、去除爬虫留下的html代码、去除评论信息中出现的表情符号和颜文字等等,对评论信息进行分词和去停用词处理;文本词向量化是指把每一个样本的文本评论数据都转换成指定维数的向量,即一个向量就是一个样本的文本评论信息。

2.2.3  文本数据分类

使用wCwNN网络、wCNN网络和CNN网络对爬取的数据进行分类,对wCwNN与wCNN网络在文本分析领域做实证研究。主要有以下几个方面:

(1)使用三种网络对训练数据进行学习。经实验,采用64维词向量模型训练数据输入各神经网络时,各网络的准确率较高。

(2)三种网络对测试集进行测试,计算相应准确率。切换不同种类的网络计算各网络的分类结果:wCwNN网络准确率为64%,wCNN网络准确率为60%,CNN网络的准确率为56%。

3  结  论

本文通过对CNN网络与WNN网络的研究,创新了两种新型的网络:小波卷积小波神经网络(wCwNN)与小波卷积神经网络(wCNN)。输入相同的仿真数据,分析对比了wCwNN、wCNN、CNN三种网络能达到的最小误差精度以及各自的训练时间。分析发现wCwNN网络能达到最小误差精度,wCNN网络收敛较快,相对于传统CNN网络来说,两种网络都有了较大幅度的提升。

在文本分类中,相较于其他的机器学习算法,三种网络的表现欠佳,经过后期查询各种资料与文献,发现可能是词向量化后的数据与现有的网络结构不匹配。相较于其他算法,CNN的卷积过程实际是对图像各部分的特征提取过程,但相同的特征提取方法在word2vec模型上可能不能有效地提取特征,有学者指出把卷积核大小设置成为词向量维度大小,并证明该种改进有效地提升了算法的效率。因此在后期的研究中,可以考虑继续研究word2vec模型与神经网络模型的适配性,可参考LSTM网络进行进一步的研究。

神经网络以能拟合任意对应关系而闻名,虽然目前各种网络还不成熟,但是对网络结构、性能的研究仍在不断进行中,相信在未来深度学习的发展能为社会解决更多复杂的问题。

参考文献:

[1] 高雪鹏,丛爽.BP网络改进算法的性能对比研究 [J].控制与决策,2001(2):167-171.

[2] 郭媛媛.地方政府网络舆情危机研究国外文献综述 [J].统计与管理,2017(2):176-177.

[3] 胡悦,王亚民.基于模糊神经网络的微博舆情趋势预测方法 [J].情报科学,2017,35(12):28-33.

作者简介:左芳玲(1997-),女,汉族,江西吉安人,本科在读,研究方向:大数据应用与深度学习神经网络。

作者:左芳玲 郭迎筱

上一篇:医药人才培养构建论文下一篇:为政以德思想启示论文