文本挖掘的网络舆情论文

2022-04-15

摘要：通过研究某知名演员偷税漏税事件的舆情走势，给出舆情分析框架，使用Word2vec模型分析人物关系，梳理事件背景，而后使用评论影响力指标筛选具有导向作用的舆论，再通过主题模型提取观点，分析舆情走势，并对不同主题观点下各类人群构成做量化分析。该分析框架有助于决策者迅速精准把握热点事件舆情，了解公众心理，反映社會风气。今天小编为大家推荐《文本挖掘的网络舆情论文(精选3篇)》，仅供参考，希望能够帮助到大家。

文本挖掘的网络舆情论文篇1：

基于文本挖掘的网络舆情研究进展述评

摘要 [目的/意义]网络舆情领域的研究受到多学科的共同关注，文本挖掘作为一种大数据分析技术，在网络舆情信息的挖掘中发挥着重要作用。[方法/过程]基于文献计量学方法，使用CiteSpace软件，以Webof Science核心合集为数据源，对基于文本挖掘的网络舆情研究概况、研究热点和研究前沿进行分析。[结果/结论]目前该领域的研究仍处于发展阶段，并开始集中向社会化媒体主题集中发展；情感分析、意见挖掘为领域中的热点关键词，2020年仍热度不减。未来几年的热点仍将集中在情感分析和意见挖掘方面，推动跨学科研究成为该领域发展的重要推动力。

关键词文本挖掘；网络舆情；CiteSpace ；知识图谱

本文使用文献计量学知识图谱分析工具CiteSpace软件 [1]，对国内外近20年来的基于文本挖掘的网络舆情研究概况进行分析，发现研究热点与前沿，并绘制网络知识图谱。数据源为Web of Science核心合集数据库，选择时间跨度为2000至2020年，通过搜索主题词“text mining”AND“network opinion”，文献类型限定为“ARTICLE”，最终得到706篇检索结果。将结果导入CiteSpace 5.7.R2构建数据集，之后通过国家机构与作者共现分析、共被引文献分析、关键词共现分析等方法分析数据并得出结论。
2 基于文本挖掘技术的网络舆情研究概况

对整体趋势分析发现，目前该领域研究仍然处于发展阶段。从2004年开始，文本挖掘与网络舆情交叉领域的研究呈逐年递增趋势，其中2016和2019年相对前一年增长最为明显，2019年的相关研究成果最多为174篇，2020年（截至12月17日）为110篇，与2018年持平。

2.1 各国研究现状与主要机构

通过分析近20年不同国家和机构的发文数，可以得到领域内影响力较大的国家及主要研究机构。从国家层面来看，领域关注度较高的为中国（192篇）、美国（95篇）、印度（77篇）和西班牙（51篇）。其中中国的研究成果数最多，约为美国的两倍，首发时间为2008年，且中心性最高为0.6，与其他国家拉开了较大差距；这说明中国在研究的最初发展阶段就进入了领域，研究水平最为突出，在世界范围内发挥着重要影响力。

在机构层面上，中国的研究机构以中国科学院、南洋理工大学、清华大学为首，发文数量均在10篇以上，在全球范围内处于领先位置；美国的亚利桑那大學、西班牙的维戈大学、英国斯特林大学都对该领域有较高的关注度。对机构发文突现分析可知，最早展开集中研究的是美国亚利桑那大学，其突现强度最高为3.16，研究集中在2018至2012年间；2011年，首尔大学、南洋理工大学、北京航空航天大学的研究增多，香港城市大学在2014年关注度增高较为明显（2.38）；之后，同济大学和上海科学技术研究院也相继开展研究。

2.2 学科领域分布与作者分析

从学科分布来看，研究文献分布在科学技术、社会科学、艺术人文三大学科领域，其中科学技术领域研究最为集中为686篇，是其他两个领域之和的2.7倍。

通过对研究者发文量、突现时间与强度、节点度的分析，可以得到领域内主要研究者，并对研究者的影响力和合作进行分析。发文数最高的作者为艾瑞克·坎布里亚（9篇），其研究从2012年开始突现，节点度为18，在研究者中的影响力最高，其研究主题为网络舆情文本挖掘的深度神经网络研究。影响力Top 6的高产作者首发年份多集中在2012年之后，但研究者陈炘钧首发日期相对较早（2008年）且有明显突现（2.57），节点度为5，具有一定的影响力，研究主题主要在社会化媒体领域，是该主题研究探索的先驱。

2.3 研究发展的阶段与脉络

通过文献共被引分析，可分析出该领域主要研究成果，并梳理出研究发展的阶段与脉络。具体是在共被引文献网络的基础上，根据主题进行T聚类，用极大似然估计（LLR）计算每个簇的标签，得到共被引文献聚类图谱（图1）。图谱中簇分布的相对位置代表不同时间阶段，越靠近左边的时间越近，越靠近右边越远，由此梳理出研究阶段与对应主题。

1）起始阶段（2000—2010）：网络舆情视域下文本挖掘技术研究。此阶段研究伊始，主题聚类标签为#4、#3、#10。2006至2008年，研究主要集中在多语言文本挖掘研究（#4）且研究数量连年递增。如2005年刘冰等人提出了一种基于语言模式挖掘的方法，可以从用户评论中提取产品功能描述[2]。2009年研究主题开始过渡到中文文档（#3）和机器学习方法（#10）。如2008年阿巴斯等人对Web论坛和博客影响进行分析，比较了几种情感分析的特征表示方法的效果，并提出支持向量回归相关合奏的方法来预测情绪强度[3]。2010年，社会化媒体（#7）的研究开始走入视野。麦克·塞沃尔等人从2007年就开始关注社交媒体MySpace，之后对社会化媒体进行持续的研究，包括对短文本数据的情感监测算法的研究，以及对社交媒体用户行为、属性及其社交关系网络的分析等[4]。

2）探索发展阶段（2011—2013）：较为分散的主题分布。此阶段研究主题聚类标签为#2、#3、#5、#7、#8、#15。2011至2012年，研究继续在社会化媒体主题上进行的同时，也在中国微博（#2）、用户认知发现（#15）等主题上有所发展。2013年开始社会网络文本挖掘（#8）成为研究的新兴主题。如穆斯塔夫·穆罕默德在消费者品牌情感进行社会网络文本挖掘的研究中，使用专业词典对诺基亚等5个品牌的Twitter平台网民情绪进行挖掘[5]。莎拉·凯瑞特娜等人通过文本挖掘在Twitter社交网络中进行用户身份识别研究[6]。

3）集中发展阶段（2014年至今）：以社会化媒体为主题持续发展。此阶段研究主题聚类标签为#0、#1。2014年开始，研究主题开始集中到社会化媒体（#1）的网络舆情文本挖掘上，之后的研究也继续沿着这个脉络不断向前发展至今（#0）。如库玛·拉维等人对2000—2015年的社交媒体情感分析研究中，总结了情感分析的主要任务、方法和应用情况，文本挖掘在社会化媒体中的应用逐渐受到重视[7]。阿莎·马尼克于2017年使用一种基于SVM的基尼索引特征选择方法，对社交媒体中电影评论数据集进行情感分类[8]。近年来，基于深度学习的社交媒体文本挖掘受到研究者的重视。如2019年泰国帕苏帕等人对CNN、LSTM、Bi-LSTM几种常见的深度学习模型进行评估，发现使用word embedding、POS标签等功能的CNN模型效果最好[9]。
3 基于文本挖掘技术的网络舆情研究热点与前沿

3.1 研究热点分析

1）关键词频次（Freq）统计分析。通过分析文献的关键词共现网络图谱，发现目前文本挖掘和网络舆情的交叉领域热点关键词为情感分析、意见挖掘、文本挖掘、Twitter、文本分类、社会化媒体、机器学习等。其中，情感分析和意见挖掘的频次最高，在数据集的706篇文献中分别占比44%和34%。

2）中心性（Centrality）分析。将关键词按照中介中心性排序，得到值最高的关键词为情感分类（0.26），其余较高的还有社会化网络（0.21）、SVM（0.13）等，说明这些关键词在多个研究子领域中比较重要且影响力强。这可能是因为社会化网络和情感分类是网络舆情研究中文本挖掘重要的应用领域，而支持向量机是机器学习经典的分类器，在情感分析和文本分类中都有广泛的应用。

3）突现（Burst）时间与强度分析。对关键词突现进行分析，可以得到关键词发展的脉络。关键词中突現强度值最高的为深度学习（9.06），说明从2018年开始深度学习成为网络舆情文本挖掘新的热点。深度学习是机器学习中一个新的研究方向，它使文本挖掘的方法不再局限于统计和传统的机器学习算法，而是可以利用卷积神经网络（CNN）、循环神经网络（RNN）、长短期记忆神经网络（LSTM）等神经网络进行挖掘，为结果准确度提升带来了更大的空间。2019年突现的关键词为情感分析、神经网络，代表着近两年的研究热点发展方向。

3.2 研究前沿分析

根据之前的分析结果，发现2020年基于文本挖掘的网络舆情研究主题将继续集中在社会化媒体上。2020年，不同国家的研究发文量仍以中国为首（30篇），其次为美国和印度，分别为18篇和12篇。研究机构中发文量最多的为伊朗的阿扎德大学（3篇），中国的机构主要有中国科学院（2篇）、南京科技大学（2篇）、北京理工大学（2篇）等；印度主要有德里大学（2篇）、韦洛尔技术大学（2篇）等。

通过分析2020年关键词共现知识图谱，可知前沿的热点研究主要集中在情感分析、意见挖掘、文本分类、深度学习、社会化媒体、神经网络、Twitter等关键词，其中情感分析和意见挖掘的共现频次最高，成为最受关注的主题。被引数较高的文献中，Greco等人将文本情感挖掘应用到品牌管理的顾客分析中，以Twitter为数据源研究用户社区的特点及产品偏好、表征和情绪[10]；阿德南·沙等人用深度学习的方法分析患者情绪，提出一种多模态方法来分析患者对医疗服务质量的情绪状态[11]。
4 总结与展望

本研究基于文献计量学，使用CiteSpace绘制网络知识图谱，对基于文本挖掘的网络舆情研究的706篇相关文献进行国家机构分析、研究者合作分析、关键词共现与聚类分析，发现目前该领域的研究仍处于发展阶段，并开始集中向社会化媒体主题集中发展；研究数量从2004年开始逐年呈现逐年递增的态势，中国、美国和印度成为领域中研究成果较为突出的国家；其研究成果主要分布在科学技术学科领域，在社会科学和艺术人文中也占有一定比例；情感分析、意见挖掘成为领域中的热点关键话题，在2020年依然热度不减。

根据之前的趋势分析和的前沿分析，未来该领域的热点应该仍集中在网络舆情的情感分析和意见挖掘上；在研究发展方向上，一方面是对理论技术模型进行不断创新和优化，另一方面是在社会科学和艺术人文领域能够应用文本挖掘技术进行更多创新型的研究。文本挖掘技术在社会科学中的应用使处理海量文本成为可能，这能够帮助研究者归纳出一些隐藏的结论，并且更加客观地分析情感、态度、观点与行为的关系。但是其应用也面临一些问题，如算法不够精准、对数据的分析解读不如人工细腻、掌握文本挖掘技术的人才较少等。因此，为了提高研究成果的质和量，如何推动跨学科研究的发展也是该领域需要重点考虑和解决的问题。

参考文献

[ 1]陈美超.CiteSpace II：检测和可视化科学文献中的新兴趋势和瞬态模式[J].美国信息技术协会，2006，57（3）：359-377.

[2]刘冰，胡敏清，程俊生.意见观察：网络舆情的分析与比较研究[C]//美国计算机协会.第14届万维网国际会议论文集.纽约：美国计算机协会，2005：342-351.

[ 3]艾哈迈德·阿巴斯，陈秀珍，斯文·汤姆斯，等.基于相关集合的网络论坛与微博使用影响研究[J].IEEE知识与数据工程学报，2008，20（9）：1168-1180.

[ 4]麦克·塞沃尔.社交网络、性别与交友：基于MySpace平台用户的分析[J].美国信息技术学会杂志，2014，59（8）：1321-1330.

[ 5]穆斯塔夫·穆罕默德.超越文字：社会网络中的消费者品牌情感文本挖掘研究[J].专家系统及其应用，2013，40（10）：4241-4251.

[ 6]莎拉·凯瑞特娜，汉尼·霍斯尼，道格·克赖顿.基于文本挖掘的Twitter社交网络用户身份识别研究[C]//IEEE系统、人与控制论国际会议.IEEE，2013：3079-3082.

[7]库玛·拉维 AB，瓦德拉玛尼·拉维 A.意见挖掘与情感分析：任务、方法与应用[J].知识库系统，2015，89：14-46.

[ 8]阿莎·马尼克，迪帕·谢诺，钱德拉·莫汉，等.基于Gini指数特征选择方法和SVM分类器的大型电影评论情感分析术语词提取[J].万维网、互联网和万维网信息系统，2017，20（2）：135-154.

[ 9]帕苏帕 S，阿尤特亚 TSN.基于深度学习的泰语情感分析：基于词嵌入、POS-tag和情感特征的比较研究[J].可持续发展城市与社会，2019：50.

[ 10]希腊·弗朗西斯卡，波利·亚历山德罗.情感文本挖掘：品牌管理中的消费者分析[J].国际信息管理杂志，2020（51）：1-8.

[ 11]阿德南·沙，严相斌，阿萨德·沙，等.基于患者意见挖掘的医疗保健服务质量评估：一种深度学习方法[J].环境智能与人性化计算杂志，2020，11（7）：1-18.

作者：常甜甜

文本挖掘的网络舆情论文篇2：

基于文本挖掘技术的社会网络舆情分析框架刍议

关键词：舆情分析;观点挖掘;主题模型;word2vec模型

一、引言

公众人物的一举一动对整个社会有很大的影响，人民群众的看法也反映了整个社会对于公众人物的认知和判断。某知名演员每年的个人收入高达数亿人民币，在去年该演艺明星被曝出令人咋舌的天价片酬，并且“一阴一阳大小合同”公然偷税漏税等行业内幕也随之浮出水面。自某新闻从业人爆出该明星的阴阳合同之后，各职能部门和媒体就一直没有中断对于该演艺明星的调查。终于，在去年10月3日，该演艺明星偷逃税案件的结果正式公布，引发媒体关注。“央视网”报道税务部门依法查处该明星“阴阳合同”等偷逃税问题。此事一出，各类媒体争相报道，微博、知乎、朋友圈都充斥着各种评论和看法，该演艺明星偷税漏税事件成为引爆社会舆论的焦点。

本研究应用爬虫技术和文本挖掘技术和自然语言处理方法，对该明星偷税漏税事件的社会网络舆情实证分析框架进行研究。

二、文献综述

（一）社会网络舆情

从李津浩在《采写编》2017年第2期发表的文章《从社会公众事件看网络舆情引导》中，可以准确地总结出公众人物的定义、特点及其对舆论的影响。社会公众人物具有公众性、典型性、商业价值、社会影响力的特点，其中最典型的特点是其言行会对社会和公众产生的巨大影响力。如果公众人物的行为举止得当，凭借他们的高知名度，会成为社会发展好的方面的代表，给公众以积极的影响。公众人物如果言行不当，在新媒体这种环境下，极易引发众怒，舆论就会呈现一边倒的声讨批评，产生网络舆情。

在网络舆情的研究方面比较成熟、主流的分析方法主要有网络调查法、基于统计规则的模式识别方法、基于内容挖掘的主题检测方法等。以上几种方法均存在一定的局限性，一些新的方法应运而生。首先，在大数据时代的背景下，数据挖掘的方法已经在更大程度和更广范围应用到网络舆情的分析和研究之中。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。其次则是聚类（clustering）分析法，即根据对某种相似程度的度量，按照相似度将数据对象分组成为多个类或簇。聚类分析法已经被广泛应用于很多方面的数据分析研究中。最后则是社会网络分析法（SNA），即通过对个体之间的关系构建模型并进行描述，对这些模型中包含的结构及其对个人和整个群体的影响进行分析。我们可以将大数据应用到日常的舆情管理中，加强对各个网络平台的监管。大数据技术的发展为传统网络舆情的管理拓宽了视野，我们可以运用大数据对网站、微博、微信等网络平台进行监控，对信息数据的传播和动态进行实时分析，以便从瞬息万变的舆情信息中找准重点，合理分配有限的资源，提高舆情管理效率。

（二）潜在狄利克雷（LDA）分布主题模型

隐含狄利克雷分布简称LDA（Latent Dirichlet allocation），首先由Blei，David M.、吴恩达和Jordan， Michael I 于2003年提出，目前在文本挖掘领域包括文本主题识别、文本分类以及文本相似度计算方面都有应用。LDA是一种典型的词袋模型，即它认为一篇文档是由一组词构成的一个集合，词与词之间没有顺序以及先后的关系。一篇文档可以包含多个主题，文档中每一个词都由其中的一个主题生成。它是一种主题模型，可以将文档集中每篇文档的主题，按照概率分布的形式给出;它是一种无监督学习算法，在训练时不需要手工标注的训练集，需要的仅仅是文档集以及指定主题的数量k即可;此外LDA的另一个优点则是，对于每一个主题均可找出一些词语来描述。本小组在文本挖掘技术层面上在文献的分类筛选中选择了LDA主题模型，LDA主题模型在国内的研究也已经较为成熟。苑东东、赵杰煜、叶绪伦（2018）在《结合深度学习的监督主题模型》中，万子玮（2018）在《基于主题词的微博用户兴趣模型研究》中提出结合深度学习的监督主题模型，利用深度网络强大的非线性拟合能力，建立文档主题分布与标签之间的映射，利用变分期望最大化（EM）和深度网络训练方法，共同完成贝叶斯框架下模型参数的更新，通过改变网络结构和激活函数的类型，用于分类和回归任务。在前人对LDA改进的基础上，将模型应用于微博用户兴趣的深度挖掘中，将模型的先验概率，更换为后验概率确定用户兴趣模型，提高了主题模型的计算效率，并且保证了主题兴趣挖掘的准确度。最后，通过召回率、查准率等评价指标对模型进行评价分析，并分析模型应用于个性化广告推荐中的适用性。

三、该明星偷税漏税事件微博舆情分析

（一）基于Word2vec模型的社会网络人物关系挖掘

1.语料准备

爬取知乎上关于“该明星偷税漏税”问题的回答共2022条。选取知乎上关于“偷税漏税”事件的回答作为word2vec模型的训练语料的原因是，知乎上的回答大部分都是长文本，非常适合word2vec的训练，而且长文本可以将关于“偷税漏税”事件相关的过程来龙去脉阐释清楚，便于word2vec挖掘人物之间的关联度。得到原始文本后，去除无关的网页标签数据，过滤出原始文本。

在语料数据预处理这个过程中，先将原始文本进行中文分词，由于我们最终的目的是要将“偷税漏税”事件相关联的公众人物挖掘出来并分析他们之间的关联度，所以我们注意的一点是对于人名的分词的准确度，构造精确的用户自定义字典。由于word2vec注重于上下文的关联，所以将词频很高的语气词和助词等对上下文关联不起作用的词语去除，构造精确的停用词列表。由于原始文本中有很多的与此事件阐述无关的网址，不能载入word2vec进行训练，所以将其剔除，最后去除所有的标点符号，得到可用于word2vec训练的文档。以下给出语料预处理的具体步骤：

第一步，将所有的回答载入一个文档中。

第二步，定义该明星偷税漏税问题的用户自定义字典，字典列表里包括明星的人名，其中也包含同一个人的多个称呼（如XXX和X老师），此外，还有相关知名影视公司。

第三步定义停用词，将词频较高的助词、语气词等定义为停用词，在分词之后這些词汇将会被过滤掉。

第四步，去除文本中所有的标点符号和网址链接，最终过滤出纯文本并将其分词，准备训练word2vec模型。

2.训练word2vec模型并输出相似度矩阵

将知乎关于“该明星偷税漏税”问题所有的回答作为语料库训练word2vec模型，并挖掘相关人物的向量相似度（即人物相关性），并得到人物关系相似度矩阵。

由于矩阵中每一个人物关系相似度都超过0.9，所以要观察他们之间相对的相似度，要将其标准化。为了防止人物关系相似度矩阵出现负数，用max-min方法对其进行标准化。这种标准化的优点是：标准化后所有的数值都是非负的，并且原数据中最小的数标准化后变为0，最大的数标准化后变为1，可以让我们清晰地观察到关系相似度最高的两个人，还有最不相关的两个人。将人物关系相似度矩阵进行可视化，转化为关系图：

3.人物关系解读与事件梳理

从人物关系图中可以直观地看出，整个事件是以该明星为中心，向外辐射出与“偷税漏税”事件相关的人物，辐射出相关的人物有演艺人物4、新闻从业者1、演艺人物3、演艺人物2、演艺人物1。在图中还可看出，与该明星关联性不大的演艺人物4，在此事件中，他和该明星是有一定的并列关系，因为他们同时被新闻从业者1所批判，因此演艺人物1和演艺人物4的相关性近似于0，说明在此事件中，演艺人物4和1毫不相关，互相不牵连。这个模型最大的特点是能挖掘公众所不熟知的人物关系，比如演艺人物2和3，公众可能认为他们两个与“偷税漏税”事件毫不相关，其实不然，他们和这个事件的核心人物都有着非常大的关联度。这个模型可以使公众有新的了解目标，主动地去搜寻看似不相关的人物的事件，而不是被动的接受媒体传播的信息。

（二）基于主题模型的舆论观点分析

1.引入微博评论影响力指标过滤舆论导向信息

使用Python+Selenium+Chrome编写爬虫程序。截至目前，获取微博话题“#该明星偷税#”“#该明星偷税、漏税#”“#该明星大轰炸戏份9秒#”“#该明星偷税漏税调查结果#”“#该明星陷偷税门#”5个话题下内容无缺失的讨论文本共计2119条，并爬取发布者信息，共计1703条（同一个人可能有多条讨论）。数据库变量类别分别为变量名、用户名、发布时间、转发量、评论量、点赞量、评论内容、性别、所在地、用户类别等。

使用转发、评论与点赞量构造微博评论影响力指标，衡量其言论所起到的舆论导向作用，过滤对舆论影响低的讨论。指标计算方法如下：

从词频图中我们可以清晰看出，作为事件主角的该明星的姓名出现次数遥遥领先其他词汇，总共出现了684次;其次是“偷税漏税”这一行为，总共出现了179次;像“罚款”“国家”“法律”“偷税”“逃税”这一类与国家法治制度相关的词汇出现次数紧随其后，基本都达到90次左右，这也体现了大多数微博用户对于国家基本法律的重视和对该明星违反国家基本法律政策的反对;除此之外，类似“视频”“明星”“大轰炸”“娱乐圈”这类有关娱乐圈电影明星的词汇的出现次数也有很多，基本上都达到了70次左右，说明部分微博用户认为该明星偷税漏税事件与整个娱乐圈风气具有一定的相关联度;最后，类似于“道歉”“补缴”“处罚”“依法”“刑事责任”“封杀”这类词汇的存在表明部分微博用户认为该明星有责任进行道歉以及受到处罚以正娱乐圈的风气。

2.舆论观点挖掘与基于FREX score的模型解读

使用LDA主题模型将1004条讨论聚类，并输出各类观点下的关键词，共得出了7大类关键词主题。

主题1侧重讨论“国家”“法律”“罚款”“有钱”等关键词，体现公众对此次事件的直观感受是比较震撼的，讨论集中在本次涉案金额较多，相关法律和罚款数额等;主题2侧重讨论“轰炸”“流出”“台词”英文版等关键词，体现此事件与电影《大轰炸》非常相关，《大轰炸》的视频流出事件成为讨论的热点;主题3中出现“演艺人物4”和“新闻从业者1”两位当事人，集中在人物关系的讨论上;主题4突出了“知错”“坐牢”等关键词，体现民众对惩罚力度的不满，并扒出某演艺人因偷税坐牢事件与此对比;主题5侧重“逃税”“娱乐圈”“艺人”等关键词，体现此次事件引发公众对娱乐圈逃税普遍现象的热点讨论;主题6出现“国家”“没有”“偷税”“戏子”等关键词，集中讨论“戏子误国”的相关内容;主题7中侧重“税款”“罚款”“税务机关”“部门”“依法”“处罚”等关键词，体现追责问责态度。主题3与主题4具有一定相似度，其讨论内容都集中在人物关系上。其中主题3与主题6的话题影响力较高，反映公众关注事件来龙去脉的讨论与国家发展层面上“娱乐至死”“戏子误国”的讨论。

考虑到某些词汇由于词频太高，导致在每个主题下的排名均靠前，例如“该明星”，排列第一位，但并不能突出显示不同主题的差异，因此引入FREX score同时考虑词语的出现频率和排他性，FREX即“Frequency and Exclusive”，同时考虑了单个词语在不同主题下的条件概率与在总体中的边缘概率。其公式表达如下：

其主体思路为，为使主题模型所得结果更加趋于信息最大化，同时考虑词语的条件概率和边缘概率，为λ赋予不同值，目的是使不同主题体现出差异，且更加可被解释。LDA模型中初始输出的结果即为λ=1时的结果。

调整λ值以获得各类主题下根据FREX score由高到低的排名顺序，发现λ取0.37时各类主题差异较为可区分，且可解释性强，综合对比发现，民众对于该明星事件的观点主要呈下列几种形式：

第一，震惊，惊叹于国家法规的漏洞，涉案金额巨大，同时也激起人们对巨额逃税款的概念的讨论;

第二，悲哀，许多人联想到默默无闻值守岗位的各领域人才，只能赚取微薄的工资，而国家发展依靠各领域人才而非影视明星，“戏子误国”，还有一部分人联想到从前影视明星因偷税漏税坐牢，而如今该明星不用如此，悲哀世道不复从前;

第三，愤怒，其一，该明星在《大轰炸》中仅出场9秒便赚取3000万元薪酬，引发民众对于目前娱乐圈影视明星收入过高的讨论，其二，对该明星强烈谴责，追查到底，绝不姑息。

3.持不同观点的人群差异分析

（1）舆论主题变化趋势

10月3日是评论量呈爆炸性增长的一天，人们纷纷在这一天在微博上发表自己对“偷税漏税”事件的看法，说明当天“偷税漏税”事件被媒体炒得沸沸扬扬，是观察舆论主题所占比例最合适的时机，所以我们将10月3日的评论所属主题汇总进行观察。

10月3日，公众发表了大量的言论，其中第6类主题占比最大，占到总体的21%，其次是第5类主题，占总体的19%。根据各类主题的关键词，我们可以挖掘出，在评论量猛增的第一天，人们主要的舆论导向是该明星触犯了法律，应该向国家和人民道歉，并有一部分的舆论在谈论该明星出演的电影《大轰炸》的上映问题。

在10月3日以后，评论量开始大幅度下降，我们观察10月3日以后的舆论变化趋势：从10月6日到10月18日，公众发表了较少的言论，其中占比最大的主题由刚开始的第6主题转变为了第4主题，第6主题在刚开始占据舆论霸主地位，然后慢慢地淡化了。根据各类主题的关键词，我们可以挖掘出，在评论的第二个阶段，人们主要的舆论导向从该明星触犯了法律，应该向国家和人民道歉，变成了该明星应该坐牢，并且该主题关键词中提到了社会的正能量，说明国民开始力挺某新闻从业人的做法，并且呼吁要保护之。

评论量在10月27日大幅度地增加，而且第一主题的占比最大，所以根据关键词，关键词中提到了娱乐、金钱，而对应着当时正在颁发诺贝尔奖项，我们作出了合理的推断，受众在这一天提出了“娱乐至死”的舆论导向，并呼吁用知识和科技去复兴中华，年轻人不应该沉迷娱乐而不能自拔。

（2）不同主题下的人群属性交叉分析

第一，在不同主题下的人群性别比例。拥有不同的舆论类别的人群中，男女比例大致相同，各占一半左右。但是在第5个类别中，女性比例明显大于男性，根据类别的关键词，可以推断出，在让该明星道歉的问题上和该明星出演的电影《大轰炸》的上映问题上，女性群体的反应是大于男性群体的。

第二，在不同主题下的人群所在省份比例。在各个类别中，北京、山东、江苏、广东这四个地区的人民充当了重要的角色，其中北京、山东和广东这三个地区在七个类别中相差无几。

其中江苏省在第三类和第七类主题中占比比较突出，根据类别的关键词，其中第三类主题的突出关键词：“该明星”“演艺人物4”“纳税”，第七类主题的突出关键词：“阴阳合同”，可以看出江苏省的人民更看重事情的真正原因和来龙去脉。

其中北京和山東与当事人的籍贯相关，江苏无锡是该明星工作室的所在地，事件爆发后，江苏省地税局对该明星工作室展开调查，引发讨论。

第三，在不同主题下的人群影响力比较。第三类主题所属人群的影响力远远大于其他类别，根据类别关键词，可以看出看重事情的真正原因和来龙去脉的人群，普遍具有很大的影响力。

四、讨论

（一）从Word2vec对知乎中关于“该明星偷税漏税看法”的文本梳理发现，涉及该明星事件的公众人物有“新闻从业者1”“演艺人物4”“演艺人物2”“演艺人物3”“演艺人物1”等人。“新闻从业者1”和该明星是本次事件的中心人物，其余“演艺人物”与该明星有并列关系，共同受到“新闻从业者1”抨击。

（二）使用多维标度法可确定事件内隐含7类主题观点。分别为“有关该明星涉案金额多的讨论”“有关该明星电影《大轰炸》的视频及台词流出的讨论”“有关事件人物关系的讨论”“有关某演艺人因偷税坐牢与此事对比”“娱乐圈逃税普遍现象的讨论”“有关‘戏子误国’的讨论”“有关税务机关问责的讨论”。其中有关事件人物关系和国家层面上“戏子误国”的话题影响力较大。

（三）10月3日事件爆发，该天公众讨论最多的话题是第五、第六主题，人们的舆论导向是该明星触犯了法律应该向国家和人民道歉，并有一部分的舆论在谈论该明星出演的电影《大轰炸》的上映问题。而后事件讨论量逐步降低，从10月6日起，原本占比最高的主题六转变为主题四，在公众讨论的第二个阶段，人们主要的舆论导向从该明星触犯了法律应该向国家和人民道歉，变成了该明星应该坐牢，并且该主题关键词中提到了正能量。10月27日，话题热度突然增长，主题一占比最高，国民在这一天提出了“娱乐至死”的舆论导向，并呼吁人民用知识和科技去复兴中华，年轻人不应该沉迷娱乐。

（四）男性微博用户偏向讨论人物关系，女性微博用户偏向讨论让该明星道歉和电影《大轰炸》的上映问题。其他主题类别下的男女比例均衡。北京、山东、江苏、广东四省微博用户讨论较多，其中北京和山东与当事人的籍贯相关。由此可见，在本话题的讨论中，涉事人与涉事机构所在地域的用户言论对舆论影响较大。

（五）第三类主题所属人群的影响力远远大于其他类别，根据类别关键词，可以看出看重事情的真正原因和来龙去脉的人群，普遍具有很大的影响力。

参考文献：

[1]吴婷.浅谈网络舆论的社会影响[J].新闻传播，2017（7）.

[2]时郁婷.论媒介融合对新闻传播的影响研究[J].大众文艺， 2011（7）.

[3]李津浩.从社会公众事件看网络舆情引导[J].采写编， 2017（2）.

[4]黄宝书，王昊宁.“新闻云系统”与齐鲁台的新闻制播创新[J].南方电视学刊，2011（2）.

[5]何佳，周长胜，石显锋.网络舆情监控系统的实现方法[J].郑州大学学报（理学版），2010（1）.

[6]苑东东，赵杰煜，叶绪伦.结合深度学习的监督主题模型[J].模式识别与人工智能，2018（8）.

[7]万子玮.基于主题词的微博用户兴趣模型研究[D].首都经济贸易大学，2018.

[8]Sievert C，Shirley K E.LDAvis：A method for visualizing and interpreting topics[C]//The Workshop on Interactive Language Learning，2014.

[9]Chuang J，Manning C D，Heer J.Termite：visualization techniques for assessing textual topic models[C]//International Working Conference on Advanced Visual Interfaces.ACM，2012.

[10]Ramage D，Hall D，Nallapati R，et al.Labeled LDA：a supervised topic model for credit attribution in multi-labeled corpora[C]//Conference on Empirical Methods in Natural Language Processing，EMNLP 2009，6-7 August 2009，Singapore，A Meeting of Sigdat，A Special Interest Group of the ACL.DBLP，2009.

作者：张行健焦政钟瑞童

文本挖掘的网络舆情论文篇3：

面向政治安全的网络谣言风险分析与防范策略研究

摘要：[目的/意义]研究面向政治安全的网络谣言风险建模与防范策略，为网络谣言风险治理提供理论基础和实践指导。[方法/过程]采用等级全息建模方法，构建网络谣言的政治安全风险情景，通过识别风险因素，进行风险量化与评级，得出高风险因素，并建立网络谣言政治安全风险防控模型。[结论/结果]依据舆情生态理论和风险分析结果，针对高风险和潜在风险因素，从主体、过程、环境等3个维度提出网络谣言政治安全风险防范的主要策略。

关键词：网络谣言;风险管理;HHM;风险建模;政治安全;政治谣言;谣言治理;舆情生态

DOI：10.3969/j.issn.1008-0821.2019.05.020

〔

Key words：internet rumor;risk management;HHM;risk modeling;political security;political rumor;rumor governance;public opinion ecology

誠然，时下有谣言便有风险的存在。任何谣言都有听众[1]，而每则谣言的背后都有各式“故事”，这些真实或虚构的“故事”为听众张开了遐想的空间，也打开了他们情绪的闸门。随着移动互联网技术和媒体融合的发展，拥有“故事”的网络谣言变得无处不在、无孔不入，于是，网络谣言成为新时代风险社会的安全不稳定诱因和风险治理的重要对象。目前，学界对网络谣言风险问题的研究主要集中在两方面：一是，关于网络谣言风险认知研究。学者刘艳等从社会系统角度认为，网络谣言风险的不确定性主要来自于谣言动机、谣言类型、传播途径等方面[2];吕晓红认为网络谣言风险的诱因主要来自于网络放大（网络匿名效应与污名化）、网络谣言恶意散播与信息不明、群体极化等方面[3]。二是，关于网络谣言风险对策研究。孙一凡等基于社会燃烧理论，通过建立网络谣言风险评估模型，结合不同时期谣言演化特性，针对性地提出了网络谣言风险对策[4];曾润喜等认为治理谣言风险应提升受众的媒介素养，加强行业自律，畅通信息沟通渠道，建立全国通用的一体化舆情应急协同平台[5]。而关于网络谣言政治安全风险问题研究相对分散，大多成果仅从政治传播学、社会学等视角探讨了政治谣言影响和治理问题，缺乏专题的深入研究。由此，本文从维护政治安全角度，结合舆情生态理论，通过对网络谣言政治安全风险建模、量化与评级，进而探讨网络谣言政治安全风险防范的主要策略。

1 网络谣言政治安全风险的内涵及主要表现

传统政治安全和非传统政治安全交织而成的复杂政治安全是时下我国政治安全所面临的时代特征。习近平总书记曾指出：“要把维护国家政治安全特别是政权安全、制度安全放在第一位”，“提升防范应对各类风险挑战的水平，确保国家长治久安”[6]。作为国家安全的根本，政治安全主要包括主权安全、领土安全、政权和政治制度安全以及意识形态安全等方面内容，具有根本性、战略性、整体性、长期性的价值表征。因而，探究网络谣言政治安全风险识别与防控问题，首先要厘清“网络谣言与政治安全的关联”，以及“网络谣言的政治安全风险的内涵”。网络谣言与政治安全的关联，主要表现在两个方面：一是不同类型的网络谣言对不同的领域安全有着一定影响，并存在一定程度上的风险交织与衍化现象;二是政治安全是网络谣言治理的核心价值取向，也为网络谣言风险分析与管理提供了必要的价值指向和研判依据。基于此，根据政治安全内容和风险理论，网络谣言的政治安全风险是指网络谣言在生成、传播、演化过程中，对国家主权、政权、政治制度以及意识形态等政治安全方面所构成的威胁或危害的可能性和不确定性[7]。一般而言，网络谣言安全风险主要受其关涉的主题领域所影响。按照关涉主题领域不同，网络谣言可分为网络政治谣言、网络经济谣言、网络军事谣言、网络文化谣言、网络社会生活谣言、网络食品谣言、网络公共卫生疫情谣言、网络生态环保谣言等多元类型[8]。从实践来看，网络谣言政治安全风险并不局限于政治谣言本身，还来源于社会、经济等其它谣言等的信息衍化与影响的政治性跃升，其内容大体涉及：领土主权、政体政权、政治腐败、主流意识形态、主要社会矛盾、涉稳、涉恐、涉军、涉警、以及涉政治人物、社会政治事件等问题。从上可知，网络谣言政治安全风险更多地体现的是一种国家安全的底线思维和风险意识。

根据舆情生态理论，网络舆情生态是网络舆情主体、网络舆情信息以及网络舆情生态环境等各种要素相互作用、相互影响而形成的动态的复合生态空间[9]。由此，通过分析网络谣言传播中政治安全风险的影响因素[7]，本文认为网络谣言政治安全风险主要表现以下3方面：

一是，网络谣言主体方面的政治安全风险。其主要体现在4个层面：1）在个体层面上，个体受众受网络谣言影响所产生的政治思想和动机极端化、政治心理扭曲化、以及政治行为激进化等风险;2）在群体层面上，群体受众受网络谣言的政治观念和价值蛊惑造成的群体感染与群体暗示、甚至群体无意识盲从或群体极化等风险;3）在媒体层面上，媒体融合与新一代信息技术发展不仅给网络谣言提供了多元的传播渠道和泛在的舆论空间，而且给网络谣言带来了更大的“眼球”效益和舆论引导力，这些也成为了网络谣言政治安全的媒介风险;4）在政府及社会组织层面上，往往存在着权威信息公开主体缺位、官员公信力危机、国际政治斗争中政治宣传与网络煽动、谣言应对的复杂性等风险。

二是，网络谣言信息方面的政治安全风险。其指的是网络谣言的信息本身及其流转过程所形成的政治安全风险，主要体现在网络谣言信息主题的集聚极化性、内容的易感煽惑性、价值的错位建构性、传播的急速扩散性、流转的多路共振性、影响的潜移默化性等风险。

三是，网络谣言环境方面的政治安全风险。其主要涉及在4个方面：1）在政治层面上，涉政网络谣言一般呈现出扰乱主流政治文化与政治生态、削弱政府公信力、诱导无政府主义蔓延、威胁政治安全等风险;2）在社会层面上，涉政网络谣言极易出现歪曲主流社会价值导向、诱发不良社会心态、激化社会矛盾、影响社会稳定等风险;3）在技术层面上，网络谣言治理要应对谣言信息传播的匿名效应、网络传播的跨时空性、以及舆情信息监测与预警的复杂性等风险;4）在制度层面上，网络空间治理存在着一定的公众制度化表达与参与渠道缺失、网络空间法制体系不健全、安全风险防控机制不完善，这些也给网络谣言的生成与扩散带来一定程度上的制度性安全风险。

2 基于HHM的网络谣言政治安全风险识别

实践表明，网络谣言风险管理是一项较为复杂的长期的系统性工程，对其可能发生的风险进行识别与预警，有助于更好进行风险管理和安全防范。等级全息建模（Hierarchical Holographic Modeling，HHM），是一种讲求全面而整体的思想和方法论，目的在于从多元视角、维度和层级中捕捉和展现一个系统的内在不同特征和本质[10]。该方法具有多层级、可分解的结构特征，可将一个复杂系统以互补、协作的方式分解成只有一级子系统的层次，每一层次都是复杂系统的某一特定视角结构，通过对每一层次的风险分析，确定复杂系统的所有风险和不确定性[11]。由此，本文通过HHM风险识别方法从多视角、多层级分析网络谣言政治安全风险因素及潜在的风险情景，并采取反复迭代的方法来确定该风险的结构框架。

2.1 网络谣言风险识别的HHM框架

综上，结合网络谣言政治安全风险内涵表现和等级全息建模思想，本文构建以主体、信息、环境等维度为支撑的网络谣言政治安全风险识别HHM框架（见图1），其中包括10个二级风险因素和36个三级风险因素。

2.2 网络谣言政治安全风险识别

上述网络谣言政治安全风险HHM框架从多维视角、不同层面展现了面向政治安全的网络谣言风险管理的基本情况，于此，通过反复迭代的过程确定可能存在的风险来源以及风险成因等风险识别的基本要素[12]，从而系统研究网络谣言政治安全风险。按照主层级的属性差异，将网络谣言政治安全风险

HHM框架构建为3层次结构：主体层、信息层、环境层（见图2）。根据分层视角下HHM框架的10个主层次，最多可凝练出90个风险情境组合，由于每个主层次下面存在多个等级全息子系统，如果通过等级重叠协调（HOC）路径，将生成百余个风险情境组合用于对网络谣言风险的识别。

本文以“政府及社会组织——信息流转”这一风险情景组合为例，阐述HHM框架在網络谣言政治安全风险识别中的应用。在分析中，以“政府及社会组织”这一主层次为基础视角，以“信息流转”为上层视角，利用其各自包含的等级全息子系统进行交互作用，理论上可生成16个风险情景源（见表1）。正如表1所示，基础视角与上层视角的不同组合构成了“政府及社会组织——信息流转”的不同风险情景，例如，“政府及社会组织”中“政治谣言应对”的失当会导致“谣言传播范围”扩大、“谣言扩散速度”提高、“谣言存续时长”增加、“谣言演化阶段”导控力弱化等多个风险情景的发生，以此类推，整个HHM框架要完成这样多项风险源的识别，并按照相关信息分类确定主题，完成风险识别。

3 网络谣言政治安全风险的量化与评级

为了能够对风险情境分析和研判提供优先次序，本文采用一定方法对网络谣言风险因素进行量化和评级。首先，将网络谣言政治安全风险HHM框架转化为对应的指标体系（见表2）;其次，应用层次分析法（AHP）对网络谣言风险因素进行量化，并计算指标权重;进而，通过ABC分类法对相应的风险因素进行评级。

3.1 基于AHP方法的风险量化

层次分析法（The Analytic Hierarchy Process，AHP），是一种面向复杂的多目标决策问题的系统方法，它能够有效分析系统要素的层级结构。于是，本文在网络谣言政治安全风险指标体系的基础上建立递阶层次结构模型，采用专家调查法构建判断矩阵，相互比较各层次中的因素，进而计算出网络谣言政治安全风险因素各指标权重（见表3），并通过一致性检验。

3.2 基于ABC分类法的风险评级

ABC分类法（Activity Based Classification，ABC），又称帕累托分析法、主次因素分析法等，是一种按照事物的主次要因素进行分类排序，从而有区别地确定风险管理策略的方法。结合ABC分类法思想，本文将网络谣言政治安全风险因素按整体权重排序，并计算累计权重（见表4），然后，根据统计分析，将风险因素分为4个级别进行评级，其中，0～40%是极高风险（Ⅰ级），41～70%是高度风险（Ⅱ级），71～90%为中度风险（Ⅲ级），91%～100%为一般风险（Ⅳ级）。

通过对以上36个风险因素进行评级得出：极高风险5个，高度风险8个，中度风险10个，一般风险13个（见表5）。其中，就风险因素评级而言，高度以上风险因素为政治谣言应对、信息辨识、谣言传播范围、群体暗示、舆论引导、国际政治宣传、主题热敏度、谣言扩散速度、谣言演化阶段、风险防控机制、网络政治生态、关键种群、内容可信度，这些风险因素是网络谣言政治安全风险管理的重点，需要治理主体予以重视和防范。从风险因素等级分布来看：1）主体风险因素的均衡分布，以及在极高风险区位的高度占比，表明了主体风险是具有根本性的内生风险;2）信息风险在高度与中度风险区位的相对集中，以及多区位分布，说明了信息风险是具有过程性的结构风险;3）环境风险主要集中在中度与一般风险区位，反映出环境风险是具有条件性的外在风险。此三者共同作用形成了网络谣言的政治安全风险生态链，并使其在网络谣言风险演化中呈现出较为明显的动态阶段性和多元衍生性。因此，这就要求面向政治安全的网络谣言风险治理要充分认知风险要素的性质和特征，把握主体、信息、环境等风险演化规律，有针对性地化解和应对由网络谣言产生的政治安全风险。

4 面向政治安全的网络谣言风险防范的主要策略

从上分析可知，网络谣言政治安全风险是一种蕴含个体与群体风险、信息过程风险与衍生风险、环境内生与外在风险等多重因素交织、链式反应的复合型风险。它随着网络谣言的生成与演化而不断与外界环境进行信息和能量的交互，并围绕“政治安全”这一根本价值而形成风险积累、扩散与消解。根据前述的风险识别框架与高风险要素分布，本文以“政治安全为核心、主体为根本、过程为关键、环境为支撑”，建立网络谣言政治安全风险防控模型（如图3所示），进而提出防范和化解网络谣言政治安全风险的主要策略。

4.1 主体多层级防范策略：个体免疫、群体引导、主体协同

网络谣言本质上是一种信息异化的产物，它根于人，而作用于人。因而，作为舆情生态主体的“信息人”成为网络谣言安全风险防范与治理的根本所在。在实践中，受价值取向、观念认知、（态度、情感等）情绪偏好、动机意向、信息行为等影响，个人、媒体、政府及社会组织等网络主体在网络谣言演化中发挥着不同作用和价值影响，往往呈现出具有“个体性”与“群体性”特征的信息生产者、组织者、传播者、消费者、管理者等多元角色，并在信息流转与能量交互中各主体间又形成了平等、共生、互动以及竞合等不同的链式依存关系[13]。于此，本文针对网络主体的个体性、群体性、以及主体间性，提出应对网络谣言政治安全风险的“个体免疫、群体引导、主体协同”多层级防范策略。

具言之：“个体免疫”是指通过教育、规约等恰当的途径/方法使得个体对网络谣言本身及影响具有一定的信息辨识分析、反应处理、以及风险防范能力。尽管个体免疫反应具有一定差异性，但通常可通过政治价值宣教、网络素养培育、伦理法律规范等途径，培树公众正确的政治价值观，引导个体政治安全意识和信息行为选择，提升个体的政治素养和网络信息识别与评价能力，使其坚守网络道德底线和法律法规，切实做到“从容对网、理性上网、阳光用网、依法用网”，不信谣、不传谣，力图从内在实现个体层面对该类谣言的自身免疫，以避免与化解因受个体政治立场、利益关联、政治素养以及信息辨识力等因素影响，在网络谣言演化中出现的思想与行为极端化、迷失或盲从等政治安全风险隐患问题。

“群体引导”指的是针对在网络谣言演化中表现出的群体性价值认知、态度倾向与情绪偏好，治理主体既要面向目标群体和随机群体，强化政治安全价值导向、信息公开与及时回应、以及科学的舆论引导等质效与评估，还要重视各类媒体平台、意见领袖、网络大V等关键种群的监管与合作。在应对涉及政治安全风险的网络谣言中，政府和主流媒体等治理主体要充分利用各类平台发布权威信息，及时、客观公布事实真相，主动设置议程，提高信息透明度和信息公开力度，从不同角度进行舆论引导，积极掌握舆论场话语权，以有效回应社会关切，引導网络群体作出理性判断，从而防范该类谣言造成更多的错位价值的群体感染与群体暗示，以及引发的群体无意识盲从和群体极化行为等高风险现象。

“主体协同”是指从个体、群体到媒体、政府和社会组织等多元主体要通过统一领导，协调和调动各种资源和力量，实现主体联动、协同治理、合力防范和化解网络谣言演化中政治安全风险。涉政网络谣言是一种混杂社情民意的社会症候和带有反权力特征的政治现象。在一定程度上，该类谣言应对不力所带来的风险要远高于谣言本身信息流转所产生的风险和负面作用，因为应对不力更多的是消解政府等治理主体的公信力，加剧网络谣言对政治安全的冲击和负面影响。因而，应对该类谣言风险更多的是依靠政府主导下的多元治理主体的协同联动与有效应对，而多方联动有效治理该类谣言的关键是建立社会多元主体共治谣言的长效机制，在应对网络谣言中充分把握“时、度、效”原则，让政府部门、行业专家、相关企业、新闻媒体和公众形成合力，共同应对网络谣言政治安全风险，形成全链条立体式的防范治理模式。

4.2 过程立体化防范策略：未谣防患、既谣防变、谣后防复

实践表明，风险全过程管理的精髓同“未病先防、已病早治、既病防变、瘥后防复”[14]中医治未病理念具有内在的价值一致性。如学者夏一雪等人在分析网络恐怖主义风险基础上，提出“无事先防、事初防变、事过防复”的管理策略[15]。于此，针对网络谣言演化阶段特点[16]，本文认为可采用“无谣先防、既谣防变、谣过防复”的全过程策略以防治网络谣言政治安全风险。具体而言：

“无谣先防”是指针对关涉政治安全方面的潜在风险进行相关领域的舆情监测和舆论跟踪，以做好对网络谣言政治安全的风险准备和事前预防，力求达到防患未然、抢占主动、超前反馈等效果。其关键在于加大信息公开力度，加强网络政治传播和政治素养教育体系建设，逐步建立健全面向全过程的立体化的网络谣言风险防控体系。诚如，信息不对称不透明在很大程度上导致政府和权威媒体的公信力被稀释，因而，政府及相关部门要针对容易滋生影响政治安全的谣言信息，有效开展预防式正面宣传，注重将信息公开和政策解读同步推出，以避免谣言滋生。

“既谣防变”主要包括“事初早治”和“事中防变”两部分内容，其中，“事初早治”是指在网络谣言演化的萌芽期，应对主体要早期介入，将谣言风险隐患尽可能消灭在初期。由于在该阶段，网络谣言只是作为信息主体对某一事件/现象的个体观点认知/情感表达，尽管主体表达的意见多元、观点分散、舆情关注度和交互度明显增多，但舆情总体关注度不高、辐射规模相对不大、影响力较低，而且衍生舆情对综合舆情传播基本无影响，因此，网络谣言在演化萌芽期防控难度相对较低，这也成为防控网络谣言政治安全风险的重要机遇期。“事中防变”是指部分涉政网络谣言因内容高热敏性，加之媒介高融合度，使其往往具有爆发性特点，不易在时间相对较短的萌芽期控制，而需要在关注度高、流转速度快、影响面广的网络谣言扩散期进行风险导控，以消解多元衍生舆情影响，防止事态进一步扩大和升级。于是，在此阶段应对主体要对网络谣言高风险和潜在风险因素进行动态识别、热度跟踪和立体监测，通过综合研判和实时信息反馈，尽可能预测网络谣言及相关舆情的动态演变走向，并对达到影响政治安全和社会稳定的风险阈值及时预警和应急响应，从而化解网络谣言风险和舆情危机。

“谣过防复”是指在网络谣言演化的消退期，网络谣言影响力随着相关舆情的关注度和交互度的降低而不断衰减和消亡，但为避免新的谣言和衍生舆情的规模性出现和大量集聚，防止网络谣言事后反复而制定的改进策略。其主要内容包含3个方面：一是，重视政治安全领域网络衍生舆情和涉政舆论的风险管理。涉及政治安全的网络谣言不仅形式多样丰富，而且内容的高热敏度和冲击力，使其在新媒体环境下呈现病毒式感染、裂变式传播，具有较为旺盛的生命力和变异性，虽影响力大，但违法成本相对较低，致使涉政谣言往往呈现反复发作、沉渣泛起。因而，在谣言治理的后续阶段要防范衍生舆情与原始谣言的并发与串联，尽可能化解网络舆情演化中对政治安全新的衍生、次生影响;二是建立涉政谣言案例库和谣言警示平台，构建部门联动、信息共享的综合性谣言治理平台，以实现预防性辟谣，进一步压缩“旧谣重炒”的空间;三是加大辟谣力度，让辟谣抵达“信息弱势群体”。信息不对称是涉政网络谣言演化的重要动力之一。辟谣的关键在于消减这种信息不对称性，让更多的人知晓“事实真相”，遏止谣言传播，化解潜在的政治安全风险。故此，有效的辟谣需要更具针对性和可获性，能够覆盖广泛的受众和多样性的群体，并使其从思想和能力上获得谣言免疫和政治素养的提升。

4.3 环境整体性防范策略：价值引领、技术支撑、依法治谣

网络舆情生态环境是网络谣言政治安全风险防范的重要基础。根据舆情生态理论，网络舆情生态环境是包括政治、社会、法律、伦理、技术、文化等多元要素的复合环境，它为防范和化解网络谣言政治安全风险提供了必要的价值导向和治理条件。因而，本文从环境维度上，以“价值——技术——制度”的风险治理逻辑，提出“价值引领、技术支撑、依法治谣”的整体性防范策略。其中：

“价值引领”是指在网络政治传播、社会管理以及文化建设等方面要以国家总体安全观为价值引领，突出网络舆情治理和网络谣言演化中政治安全导向和正向舆论引导，大力弘扬社会主义核心价值观念和网络正能量，着力把政治安全观和网络安全观融入网络政治传播和文化建设的内容供给、传播过程、运行机制和治理方式中，有序推进网络政治生态建设和网络舆情治理的健康发展。在网络谣言的风险治理实践中，坚持政治安全的价值引领，就是使之成为网络主体在网络信息活动、评价和选择过程中的主体精神和价值取向。其主要体现两个方面：一是，在意识形态层面，网络主体要能够自觉认同和接受主流价值观，对多元网络文化有充分的认知和理性的选择能力;二是，不仅要通过主流网络文化观念来引领，更重要的是形成实践效应，使得政治安全观和社会主义核心价值观内生为网络主体的价值认同、思想认同、政治认同、情感认同。尤其是在对外政治传播方面，更要提升政府和主流媒体在总体国家安全观和社会主义核心价值观方面的传播力、引导力、影响力、公信力。

“技术支撑”是指针对类型多样、数量庞杂、裂变扩散的网络谣言，面向全过程的网络技术防控手段成为有效防范网络谣言政治安全风险的必要保证，从舆情监控、预测，到信息核实、谣言阻断等方面既需要强有力的技术支持，又要紧跟新技术发展。其关键主要体现在3个方面：一是，加强网络基础设施建设，扩大信息覆盖范围，从而拓展社会主体的信息交往空间和信息视野，增强社会主体间的信息流动和信息辨识力，以加大网络主流政治文化和权威信息传播覆盖面，提升网络空间正能量影响力;二是，不断创新网络舆情监管技术和手段，通过文本挖掘、语义分析、人工智能等技术对涉政网络舆情信息等进行监测、分类和追踪，及时快速地捕捉具有谣言征兆的网络信息，并“采用数字认证、防火墙和敏感詞过滤、口令识别等技术手段，对网络谣言实施有效的管理与监控”[17]。如在2017年，今日头条与美国密西根大学合作成立AI反谣言研究联盟，将自然语言处理（NLP）等人工智能技术应用于反谣言，（力求）提高反谣言的技术手段，及时阻断谣言传播[18];三是，深入推进网络辟谣平台的集成化和综合化。对于辟谣问题并不是一个单纯的技术问题，并非有大数据、精深算法及人工智能等就能解决。如实际上，“每一个网站平台只能溯源自己平台上的谣言首发者。对谣言溯源以及谣言发布者‘画像’，要在多家网站的协同之下共同完成”[19]。因而，需要以政府为主导，联合主流媒体与各研究机构共同搭建“功能集成、多媒融合、研技互补、管理与服务一体”的综合性网络辟谣平台，使得各治理主体间在“资源——技术——信息——数据”等方面连通共享、扬优互补与有机整合，从而形成防范网络谣言安全风险的技术支持和治理合力。

“依法治谣”是指在总体国家安全观和社会核心价值观引领下，运用法治思维，不断创新和完善网络空间法制建设，不断深化以法防谣、以法治谣、以法止谣，从整体上为网络谣言安全风险治理提供坚实的环境基础和制度保障。时下，针对网络谣言安全风险治理所面临的“管控难度大、处罚力度不够、违法成本低”等现实困境，“依法治谣”主要体现在4个方面：一是，立法上要防治并举。要把总体国家安全观和社会主义核心价值观融入网络谣言治理方式，分类分级管控网络谣言，“使互联网管理相关法律法规更好地体现国家的价值目标、社会的价值取向、公民的价值准则”[17]。正如，有学者指出，要明确打击网络谣言责任主体、属地管辖原则、部门协助责任、处罚惩罚标准、网络运营商行为规范等准则，形成涵盖不同层级、覆盖网络管理各领域和环节的法律法规体系，增强执法部门打击网络谣言的操作性，规范网络使用实体法律意识和网络行为，对网络谣言的制造者和传播者形成威慑[20];二是，执法上要审慎严格。涉政网络谣言危害大、影响广，坚持秉公执法，官谣与民谣治理问题切勿“双重标准”，要加大网络空间治理力度，严惩各类涉政谣言的造谣者和恶意传播者;三是，司法上要民主公正，确保办案过程符合程序公正、办案结果符合实体公正，从国家安全观和社会核心价值观上深化司法民主、引领司法公正;四是，守法上要规范引导。在宣扬国家安全观和社会主义核心价值观过程中，要持续宣贯社会主义法治精神，不断增强政府及其他社会主体的法治意识和安全意识，形成崇尚法律、遵守法律、维护法律权威、保障法律实施的良好法治氛围，在全面推动网络空间法治化背景下，充分发挥法治精神对网络谣言风险治理的引领和规范作用。

5 结语

综上，备预不虞以化风险，德法兼济从善治谣。实践表明，面向政治安全的网络谣言风险防范是一项涉及主体、信息、技术、文化等多元要素的系统治理工程。本文通过对网络谣言政治安全风险的内涵解读、风险识别与评级、以及风险防范策略等方面的研究，主要得出以下结论：

一是，网络谣言政治安全风险是一种蕴含个体与群体风险、信息过程风险与衍生风险、环境内生与外在风险等多重因素交织、链式反应的复合型风险。它随着网络谣言的生成与演化而不断与外界环境进行信息和能量的交互，并围绕“政治安全”这一根本价值而形成风险积累、扩散与消解。

二是，政治谣言应对、信息辨识、谣言传播范围、群体暗示、舆论引导、国际政治宣传、主题热敏度、谣言扩散速度、谣言演化阶段、风险防控机制、网络政治生态、关键种群、内容可信度等共同构成了影响网络谣言政治安全的高风险因素，而这些风险因素是网络谣言政治安全风险管理的重点。

三是，从舆情生态和风险管理角度来看，大体可从主体、过程、环境三个维度防范网络谣言政治安全风险，即：①主体维度上要强化“个体免疫、群体引导、主体协同”的多层级防范策略;②过程维度上要优化“未谣防患、既谣防变、谣后防复”的立体化防范策略;③环境维度上要深化“价值引领、技术支撑、依法治谣”的整体性防范策略。

参考文献

[1]（美）奥尔波特，等.谣言心理学[M].刘水平，等译.沈阳：辽宁教育出版社，2003：129-133.

[2]刘艳，刘荣.社会系统理论视域下的网络谣言风险分析[J].领导科学，2013，（14）：11-12.

[3]吕晓红.网络言论自由与网络谣言风险的关系研究[J].新闻知识，2013，（1）：37-38.

[4]孙一凡，兰月新，张鹏，等.基于社会燃烧理论的网络谣言风险对策研究[J].现代情报，2015，35（5）：14-19.

[5]曾润喜，朱利平.基于政治信息视角的网络谣言风险发生机理与治理研究[J].图书与情报，2016，（4）：1-7.

[6]习近平.全面提升防范应对各类风险挑战的水平，确保国家长治久安人民安居乐业[N].人民日报，2017-01-13，（1）.

[7]李昊青.面向政治安全的网络谣言生态治理研究[J].现代情报，2018，38（10）：43-50.

[8]蒲玉忠，薛健飞.网络谣言叙事范式及“跟进式”治理研究[M].北京：中国矿业大学出版社，2017：27.

[9]李昊青，兰月新，张鹏，等.网络舆情生态系统的失衡与优化策略研究[J].现代情报，2017，37（4）：20-26.

[10]（美）海姆斯.风险建模、评估和管理（第2版）[M].胡平，等译.西安：西安交通大学出版社，2007：83.

[11]向鹏成，常微.基于HHM的跨区域重大工程项目风险因素识别[J].世界科技研究与发展，2015，（2）：67-72.