网络舆情监测系统

2024-05-04

网络舆情监测系统(精选8篇)

篇1:网络舆情监测系统

舆情监测系统介绍

功能和服务

舆情监测系统的数据是经过清洗、过滤、抽取、分析和挖掘的,舆情监测系统的主要功能并不只是提供简单的舆情信息搜索,而是具有全网搜索、定向监测、自动发现,自动预警,趋势分析,自动分类等功能,具有丰富的统计结果。

而互联网搜索引擎只能提供相关的搜索服务,要靠人工主动去搜索,搜索结果出于商业利益的驱动,掺杂很多的不合理的因素,准确性、可用性不强。全面性和及时性方面完全不能满足舆情监控的需要。

采集范围和深度

舆情监测系统所采集的信息范围主要是定向的,是用户关注的特定区域、特定领域的网站,针对这些网站可以做到全面采集和精准采集。虽然baidu/google等互联网搜索虽然采集范围广泛,但是针对具体的舆情载体,采集深度不够,采集不全面。

目前搜索引擎的数据采集采用的是广度优先策略,会根据url地址进行重复采集的控制。对于论坛、贴吧等舆情载体不会按照主贴、跟帖、翻页的方式进行精确采集,采集深度满足不了舆情监控应用的需要。

西盈网络信息雷达系统专门针对西盈网络舆情监测(监控)系统和西盈竞争情报系统开发而成的,深度挖掘技术超越了google等以智能化和广度见长的搜索引擎爬虫系统。

更新速度

舆情监测系统用户可以自己设置采集的更新频率,对于舆情高发的载体网站可以做到分钟级的更新,这一点互联网搜索引擎是无法达到的。互联网搜索引擎的采集周期一般都是数天或者数周,甚至会出现漏采,无法采集的情况。

采集的网站种类

舆情监测系统可以做到对新闻,论坛,博客,贴吧等舆情载体的全面采集,尤其是针对论坛(包括跟帖),贴吧等这些“草根”网站(这些媒体往往是舆情高发区域),实现全面、迅速的舆情采集的同时,可以实时更新信息的点击数,回复数,转载数等等。而互联网搜索引擎大多是采集新闻网站,而对于论坛,贴吧、博客等等往往无能为力,更无法提供舆情分析需要的统计数据。采集数据的有效性

互联网搜索引擎所采集的数据,往往是没有经过过滤的,甚至充斥着大量的广告等垃圾信息。这些信息往往可以作为舆情的并不多。而舆情监测系统所采集的数据全部都是有效的,和用户相关的,真正称之为舆情的数据。

舆情信息储存和利用

舆情监测系统的信息是储存在用户本地的,可以进行归档,分析利用以及作为应用系统的数据来源,但是针对互联网搜索引擎中的数据,用户没有任何干预的手段,只能通过其固定的检索服务进行访问。

相关信息的数量

百度和谷歌等互联网搜索引擎虽然拥有绝对多的数据量,但是对于和用户相关的舆情信息,由于其没有定向采集全面,深度等优势,其收录数量就会大大低于舆情监测系统。另外,舆情监测系统集成了互联网搜索引擎的元搜索功能。可以整合多个搜索引擎的搜索数据。

总结

成功的舆情监测系统是主动告知用户google等搜索引擎中或收录或没有收录的与“我”相关的舆情信息。重大事件及时预警,并提供量化的统计分析数据助力舆情分析,通过自动生成舆情报告等方式辅助舆情工作。

网络舆情监控系统解决方案

方案背景

据中国互联网信息中心调查,截至2009年12月31日,中国网民达到3.84亿人,全国互联网普及率28.9%,手机网民规模达到2.33亿。网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。网络环境下的舆情信息的主要来源于新闻评论、BBS、博客、聚合新闻(RSS),网络舆情表达快捷、信息多元,方式互动,具备传统媒体无法比拟的优势。

由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点,越来越多的网民乐意通过BBS论坛、博客、新闻跟贴/转贴等渠道来表达观点传播思想。如果引导不善,负面网络舆情将对社会公共安全形成威胁。对相关部门来说,加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。对企业来说,准确掌握产品和市场情况,监控竞争对手和行业动态,是企业市场、行销决策的重要支撑。方案内容

系统介绍

易观网络舆情监控系统,整合互联网信息采集技术及信息智能处理技术,通过对互联网海量信息自动抓取、自动分类聚类、主题检测聚焦,倾向性研判等,实现用户的网络舆情监测和新闻主题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。

系统结构图

系统组网图

系统功能

1)深度多渠道网络信息采集,为用户提供监控源配置功能,可以对监控源的优先级进行配置调整。

2)完善的信息预处理机制:超链分析,编码识别,URL去重,锚文本处理,垃圾信息过滤,内容去重,关键字抽取,正文抽取等。

3)强大的索引分词机制,对舆情信息实施双重过滤,具有自动分类、自动聚类、相似性排重功能,系统能够自动完成热点发现。

4)热点舆情:系统自动识别出热点焦点事件,以舆情形式分新闻、论坛和博客三种类别呈现。及时发现网络热点信息。

5)专题追踪:生成专题报道对网络话题进行专题化的侦测和追踪,如两会、奥运会,对专题话题形成系统性的掌握和监控。

6)分站/分类浏览:对系统中舆情可以按网站和不同的分类进行浏览。同时可以对显示的舆情进行操作(设置影响、入简报、专题、收藏、删除)。

7)趋势分析:来源载体/站点分布、单个/多个关键词热度曲线图、主题/关键词热度的整体趋势、文章转载量日均/总体趋势分析、舆情信息的地域分布、网民检索行为分析。

8)突发事件分析:对突发事件进行预警,跨时间、跨空间综合分析,获知事件发生全貌。9)多种舆情检索方式:可按网站、类别、时间段、关键词等条件进行专项化全文检索,并可生成查询时间和次数、关键词查询频率等查询统计数据。另外还将结合检索关键词,随时补充全文检索库中的关键词,有机结合个人操作习惯,可在检索结果中进行二次检索。

10)舆情统计报告:根据舆情分析引擎处理后生成报告,用户可通过浏览器浏览,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。

11)统计报表:系统生成各种形式的报表。报表包括图表和数据表格,图表包括饼图、折线图、直方图等,如总量图、趋势图等;数据表格是对舆情信息的数理统计,以数字的形式记录各项舆情数据。另外用户可以自己需求定制报表模版,比如日报、周报、月报等。

12)舆情报警系统:对突发事件、涉及内容安全的敏感话题及时发现并报警,系统提供多种报警方式。

系统特点

1)精准全面的网络舆情采集,能够对论坛、博客、新闻评论等内容进行全面、精确的采集和及时的更新,为舆情分析提供强有力的数据保障。

2)多维度实时监测、过滤网络舆情信息,采集到本地的文章会自动标注并分析,具有趋势图直观展现。

3)专业的舆情办公平台,用户可以根据实际工作需要,将需要关注的信息定制到系统,用户可以随时调出自己需要的资料,直接追踪关注事件的传播源头,把握传播动态,系统自动生成舆情报告,节省用户人力。

4)专业的舆情分析顾问服务,基于易观深厚的互联网行业背景以及对网络舆情深刻的认识,协助用户进行舆情监控设计,对用户背景、行业特征及需求做深度调研,给出最适合用户的舆情监控方案。

5)丰富的舆情项目开发实施经验,有专业的舆情实施队伍和资源,提供从舆情监测规划、舆情系统选型、舆情项目实施、舆情工作开展到舆情干预的一体化的舆情系统解决方案。

6)拥有成熟的舆情产品,可以根据用户要求定制,需求牵引及时,在保证效果的同时提供良好的用户体验。

商业价值

帮助客户全面、及时、精准、专业、高效获取网络舆情并为己所用;

第一时间获取客户相关的正负面新闻、泄密信息、领导相关报道、近期舆论热点等,健全危机事件预警机制防患于未然;

协助企业客户准确掌握产品和市场情况,监控竞争对手和行业动态,为企业市场、行销决策提供支持支撑服务。

附件1:

“网络游戏未成年人家长监护工程”实施方案

“网络游戏未成年人家长监护工程”是一项在政府部门、人民团体指导下,社会和家长参与,网络游戏经营单位具体实施的社会行动,旨在加强家长对未成年人参与网络游戏的监护,引导未成年人健康、绿色地参与网络游戏,构建和谐家庭关系。该工程自2011年3月1日起全面实施。

一、“家长监护工程”的主要内容

(一)网络游戏经营单位建立专门的服务页面,公布专线咨询电话,开通专门受理渠道,介绍受理方式。

(二)家长需要了解、引导、控制孩子游戏活动的,由家长向网络游戏经营单位提供合法的监护人资质证明、游戏名称账号以及限制措施等信息。限制措施包括:限制每天或每周玩游戏的时间长度,限制玩游戏的时间段,或者完全禁止。

(三)网络游戏经营单位按照家长要求对未成年人的账号采取限制措施,并持续跟踪观察,及时反馈该账号的活动,为家长提供必要协助,制止或限制未成年人的不当游戏行为。

二、实施“家长监护工程”的具体要求

各网络游戏经营单位要做到“四有”,即有专人负责、有专线电话、有专区设置、有季度报告。

(一)专人负责

1.要指定专门的负责人,并将指定负责人及联络方式向所在地省级文化行政部门备案;

2.培训专门服务人员对“家长监护工程”提供专业咨询解答和服务支持;帮助家长了解被监护人游戏行为,提供家长与被监护人进行沟通的建议;

3.服务人员要持续跟踪每个申请,及时与家长沟通情况,反馈该账号的活动,了解未成年人参与游戏的状况,为家长提供必要协助。

(二)专线电话

1.开通单独的专线服务电话(区别于普通服务热线),提供咨询解答和受理服务;

2.在原有的客服电话中提供转接到专线服务电话的链接;

3.要提供多种服务渠道,确保家长可选择最便利的方式提出服务申请(传真、网络申请、电子邮件、信函邮寄、上门申请等)。

(三)专区设置

1.在网站设置“家长监护工程”专区,在主要运营产品网站的显著位置设置进入该工程页面的链接方式; 2.专区要有对工程情况、申请条件、处理流程、可采取的监护结果等事项的说明;

3.要在专区显著位置设置监护服务申请入口、受理方式(家长监护专线);

4.专区要预设好问题和答案,或展示虚拟案例操作流程及结果,供家长阅览和参考;

5.专区要设置服务申请进度查询;

6.专区要登载《未成年人健康参与网络游戏提示》(附件2),引导未成年人健康地玩游戏、玩健康的游戏。

(四)季度报告

各网络游戏经营单位要在每季度末向所在地省级文化行政部门提交“家长监护工程”情况报告。报告内容包括咨询数量、申请数量、受理与完成情况、重点案例分析、疑难问题说明,对于工程实施过程中出现的问题提出意见或建议。

三、强化信息公开和社会监督

文化部在中国文化市场网设置“家长监护工程”专栏,公布网络游戏经营单位名录、各经营单位“家长监护工程”服务网站主页、热线电话等信息,供家长和社会查询和监督。

篇2:网络舆情监测系统

免费工具虽然不要使用费,且能够获取需要的信息,但费时费力,对于品牌型等网络舆情监测要求较高的企业并不可取。目前国内致力于网络舆情监测软件开发,如托尔思TRS、方正电子政务、邦富软件、线点科技、中科点击、本果信息技术、古尼软件、迅奥科技、蓝通百特、维思比科技、iri网络口碑、红麦软件、新联财通、易宝等等。分析上述公司开发的舆情监测软件,主要包括以下功能:

1、自动采集功能

付费舆情监测软件把人工收集舆情的繁琐工作自动化了,其功能与搜索引擎的蜘蛛爬虫类似。当然,作为舆情管理系统,在自动采集页面后,还需要做自动分类、自动生成摘要,自动获取关键词,并建立索引。

2、分析处理功能

分析与处理功能主要表现在传播路径分析、话题演化分析以及观点倾向分析等。以TRS互联网舆情管理系统为例,具有话题发现与追踪、信息预警机制、倾向性分析、信息过滤、多维度关联舆情分析与舆情专题、舆情干预等功能。

3、统计报表功能

用符合用户习惯的可视化形式表现分析与处理的结果,也是付费舆情管理软件的一项重要功能。该项功能主要包括舆情简报、趋势图表、聚类图等,一些智能化的软件还会给出文字概述及舆情应对建议

等。

4、协同工作功能

部分舆情管理系统除了具备上述功能外,还有部分OA的功能,能够为后期企业各部门协同应对舆情提供OA环境。

篇3:论网络舆情监测系统的基础设计

1.1信息采集及时

及时性包括两个方面采集性的及时性与信息分析的及时性。首先在海量的网站中根据影响力的排名, 选取有限的主流权威站点做为首要信息采集源, 提升效率保证信息采集的及时性。

1.2数据研判高效

舆情情报的高效性往往被人忽视。现有舆情系统收集到的各种文章90%以上的信息是与用户无关的, 大量是重复冗余的, 据说美国911发生之前已经接到了预警情报, 但是没有有效地过滤出来, 淹没在各类情报资料当中, 解读的代价太高, 最终事发后才发现情报就在情报官的办公桌上。

现有的舆情监测系统往往缺乏有效机制快速筛选并保存有价值信息, 要求网络舆情监测系统必须提供人工智能的方式学习各种情报样本, 将有潜在价值的情报从海量信息库中挖掘过滤出来, 从而提高研判的效率。

1.3范围覆盖全面

舆情信息的采集要具备全面性其中包括信息的来源与信息的内容;信息来源的全面性:是指采集时需要, 采集到绝大多数舆情信息的集散地。主流且权威的微博、新闻门户、BBS、评论等必须包含其中, 比如天涯、新浪等。内容的全面性是采集时要把舆情主体内容全面采集到位。如有分段的信息, 转载的信息和评论信息等。

1.4热点分析精准

舆情信息往往包容万象, 是非难辨, 因此要求采集内容的参数较多。如:信息的标题、正文、评论、发布者、发布时间、浏览量和转载量等。并利用科学合理的热点分析模型和预警模型, 准确地进行热点分析和舆情预警。

2系统体系结构设计

2.1网络舆情监测系统总体可分为5个层次:舆情集散地、舆情的采集、舆情信息的预处理、信息分析挖掘、舆情处理。这5个层次关系, 如图1所示。

(1) 对舆情信息集散地的选择至关重要, 准确地确认舆情信息的来源, 才能提升舆情采集的全面性。网络舆情的主要载体是微博、BBS、博客、以及具有评论功能的新闻门户, 以上几种载体就是网络舆情的主要发源地。

(2) 舆情信息的采集主要是网页信息采集, 通过分析网页的结构对网页上面的主要信息进行采集。从网页上自动获取舆情信息, 并且跟踪转载不断向整个舆情事件扩展的过程。当前, 根据主要的网页信息采集可以分为两种:一是基于主题关键词的网页信息采集、二是基于网页元搜索的信息采集。

(3) 舆情信息预处理是对从网页上采集的舆情信息进行初步的过滤和加工, 为后续的舆情信息分析挖掘工作打下基础。主要有基于多文档的自动摘要、关键词提取、话题去重、信息过滤等核心技术。

(4) 信息分析挖掘是对预处理后的数据进行更科学的分类、聚类、倾向性分析等工作。其中分类包括根据舆情信息热点话题模型确定舆情级别。通过倾向性分析确定舆情导向。

(5) 舆情的处理包括突发舆情预警、舆情追踪、舆情引导和生成舆情报告, 首先根据分析得到的相关数据, 根据相关预警模型, 实施预警和追踪, 然后向决策者汇报, 并追踪引导处理过程。

2.2网络舆情监测系统总体结构, 主要由舆情主题规划、舆情信息采集 (预处理) 、舆情信息分析、舆情预警处理4个部分组成。如图2所示。

(1) 舆情主题规划是指舆情监督部门根据自己的舆情需求选择合适的舆情主题词及其对应的种子URL集合, 确定舆情信息采集任务。

(2) 舆情信息采集主要是Web信息采集, 通过Web页面之间的链接关系, 从Web上自动获取舆情页面信息, 并且随着链接不断向整个Web扩展的过程。同时, 进行舆情信息预处理, 主要是对采集到的相关舆情信息网页进行初步的加工和处理, 为后继的舆情信息分析奠定基础。

(3) 网络舆情信息分析是指对从网络中所采集到的新闻、评论等信息素材, 进行热点挖掘和预警分析等操作, 涉及到文本聚类、话题合并、热点分析模型和预警模型构建等。

(4) 舆情预警处理包括舆情信息预警、舆情报告和舆情引导, 首先根据分析统计得到的相关舆情信息, 根据相关网络舆情预警指标, 实施报警和预测, 然后向相关部门汇报经过总结的有规律的舆情, 从而为舆情工作者的决策提供服务。

摘要:网络舆情监测系统实时定向采集主流权威有影响力的微博、新闻、论坛、博客等网站信息, 抽取舆情要素, 发现舆情热点, 挖掘舆情敏感话题, 及时预警, 追踪发展情况, 并研判舆情态势。本文就此进行简要论述。

篇4:网络舆情监测制度初探

[关键词] 社会舆情;网络舆情;舆情监测制度

【中图分类号】 TP393 【文献标识码】 A 【文章编号】 1007-4244(2013)12-015-1

一、舆情对司法的影响

首先,通过下面一组案例了解社会舆论,尤其是社会舆情对司法的影响:

(一)泸州二奶继承案:2001年,黄某立遗嘱将财产遗留给情人张学英,并进行了公证。黄去世后,其妻拒绝将其遗产交付张。张遂提起诉讼,引起许多媒体的关注,更引发了法律界的争论,网络上舆论纷纷,给审判机关带来了很大压力。法院判定遗嘱无效。二审维持原判。

(二)李思怡案:2003年6月4日,长年吸毒的成都妇女李桂芳因偷盗被抓,后被送去强制戒毒。李桂芳被抓后,曾多次极力哀求抓她的人去救出被关在屋里的无人陪伴的女儿李思怡,但都遭到拒绝,最后只是简单的通过电话进行联系,在戒毒所里求助时同样没有给予答复,其家人及邻居也都未接到通知,导致其3岁幼女李思怡被困家中活活饿死,直到6月21日才被发现。四川媒体记者在网络发文,立即引起广泛关注。人民法院公开审理此案,涉案民警被以涉嫌玩忽职守罪提起公诉。8月19日,成都市新都区法院对原金堂县公安局城郊派出所副所长王新和民警黄小兵公开宣判,以玩忽职守罪分别判处王新和黄小兵有期徒刑三年和两年。

(三)河南“喝水门”案:2010年2月18日,河南省鲁山县一名叫王亚辉的男青年因涉嫌盗窃罪,被公安机关带走,3天后其亲属被告知,王亚辉已在看守所内死亡。亲属查看尸体后,发现死者身上有多处伤痕。对此,当地警方解释,犯罪嫌疑人是在提审时喝开水突然发病死亡。当地警方“喝开水死亡”的说法一经报道,立刻引起广泛关注,“喝开水”一词迅速成为网络热词。同时,不少网友也发出检察机关能否查明事件真相、能否依法公正处理的质疑。河南省检察院监测到鲁山县“喝水门”事件的舆情信息后,指示平顶山市检察院介入,迅速查明了4名公安人员的刑讯逼供行为,4名涉案人员被依法批准逮捕。至此,这起网络舆论事件才渐渐平息。

以上几个案例,都可以看出社会舆论监督特别是网络舆情对案件审判产生影响,包括积极影响(李思怡案),也包括消极影响(泸州遗产案);同时值得注意的是,司法机关的舆情监测与相应的举措也对案件结果起到重要影响。那么,到底什么是网络舆情、舆情监测,后者对前者有什么影响,又应该怎么去完善,笔者将在本文提出一些个人想法。

二、网络舆情概述

(一)网络舆情的概念。天津社会科学院舆情研究所王来华研究员在国内最早对舆情进行系统性定义,其研究认为“舆情是指在一定的社会空间内,围绕中介性社会事项的发生、发展和变化,作为主体的民众对作为客体的国家管理者产生和持有的社会政治态度。”网络舆情是由于各种事件的刺激而产生的通过互联网传播的人们对于该事件的所有认知、态度、情感和行为倾向的集合。

(二)网络舆情的特点。网络舆情形成迅速,对社会影响巨大。网络的开放性和虚拟性,决定了网络舆情具有以下特点:1、直接性,通过BBS,新闻点评和博客网站,网民可以立即发表意见,下情直接上达,民意表达更加畅通;2、突发性,网络舆论的形成往往非常迅速,一个热点事件的存在加上一种情绪化的意见,就可以成为点燃一片舆论的导火索;3、偏差性,由于发言者身份隐蔽,并且缺少规则限制和有效监督,网络自然成为一些网民发泄情绪的空间。

三、舆情监测制度概述

(一)舆情监测制度的概念。舆情监测,是通过对互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点的一种监视和预测行为。

(二)舆情监测制度建立保障。网络舆情监测体系的建立主要依靠两方面保障:一是人力、资金等物质方面的保障,二是计算机软件系统等技术方面的保障。随着互联网技术的不断更新,网络舆情监测和舆情分析有必要通过与之相匹配的科技手段来进行。

四、舆情监测制度建议

(一)加强对各类网络论坛,尤其是市县级论坛的舆情监测。加强地方网络舆情监测,应建立以当地新闻媒体和网络论坛为先锋、以政府和事业单位为后盾、以同级司法网站为互访对象的舆情监测网,搭建夯实的技术平台,对网络不良信息严格管理和控制。

(二)加强全国性、主流论坛和主流网络媒体的议程设置引导。全国性、主流论坛往往是舆情热点事件的“孵化器”,同样值得我们高度重视。这类主流论坛和网络媒体通常具有较强的组织性和影响力,可以与传统新闻媒体一样通过“议题设置”把网民的注意力和社会关心引导到特定的方向。

(三)加快司法部门对涉法网络舆情的应变速度。畅通网络与司法部门的舆情沟通渠道,确保司法部门能在网络舆情事件发生后的最短时间内作出正确决策。司法部门应拓展自己的网络传播阵地,创办好法院网站,对题材敏感、社会关注度高的案件在充分策划后及时公布结果。这是平衡网络舆情与司法审判关系的根本途径。

参考文献:

[1]人民网舆情监测室.网络舆情热点面对面[M].北京:新华出版社,2012.

[2]人民网舆情监测室.如何应对网络舆情——网络舆情分析师手册[M].北京:新华出版社,2011.

[3]杨兴坤.网络舆情研判与应对[M].北京:中国传媒大学出版社,2013.

[4]唐钧.应急管理与危机公关:突发事件处置、媒体舆情应对和信任危机管理[M].北京:中国人民大学出版社,2012.

篇5:基于网络舆情监测系统的分析

[摘 要] 随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网民数量的持续快速的增加,以及网民通过网络形成的舆情越来越得到社会的广泛的关注。网络舆情监测系统就是针对网络舆情热点问题的预警。

[关键词] 网络舆情 监测 分析

随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。中国网民数量也在持续快速的增加,2010年7月15日,中国互联网络信息中心(CNNIC)发布《第26次中国互联网络发展状况统计报告》,报告显示,中国网民规模达到4.2亿,手机网民民规模更达2.77亿。网民通过网络形成的舆情越来越得到社会的广泛的关注。从2003年的非典、孙志刚事件,到2010年教育局封杀论坛事件、马鞍山局长打人事件等等。这些事件性质、主体各不相同,但是有一个共同的特点,即他们都是通过网络而放大了事件的影响力。

1.网络舆情监测系统的概念

网络舆情是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点。

最近几年各种社会机构组织、企业、各级政府都纷纷重视网络舆情,2008年7月,江西60多位县级官员实名开博,多数是收集当地网民关注的民生问题。2010年9月8日,人民网?中国共产党新闻网正式推出“直通中南海――中央领导人和中央机构留言板”。该留言板突出互动性,旨在让广大网友对中央领导人倾诉心声,给中央机构提出意见和建议。

由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点,越来越多的网民乐意通过BBS论坛、博客、新闻跟贴和转贴等渠道来表达观点传播思想。如果引导不善,负面网络舆情将对社会公共安全形成威胁。对相关部门来说,加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。对企业来说,准确掌握产品和市场情况,监控竞争对手和行业动态,是企业市场、行销决策的重要支撑。

从现在的网络舆情传播速度来看,信息出现后的1至3小时就可以被转至多家论坛,6小时后就可以被多家新闻网站转载,24小时在网上的评论和跟帖就能制造出热点事件和舆论高潮。因此能够第一时间知道现在哪些是热点舆情,哪些将会成为热点舆情,对于我们来说至关重要。

“网络舆情监测系统”是针对在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度于网络上表达出来意愿集合而进行的计算机监测的系统统称。通过这个系统,能够让我们有效的对网络舆情进行预警和应对。

2.网络舆情监测系统结构

网络舆情监测系统分为五大系统,分别是:网络舆情采集系统、网络舆情存储系统、网络舆情分析系统、网络舆情检索系统和网络舆情发布系统。如图1:

网络舆情采集系统会对互联网中的主要门户网站新闻、各大论坛的热门贴、关注度比较高的博客和微博以及各大主要的网络搜索引擎的热搜内容进行采集。采集后的数据存储进入统一的网络舆情存储系统。网络舆情分析系统对存储在舆情存储系统中的信息进行分析,把舆情内容归纳、整理、分类后得出最近阶段舆情的变化及趋势,并把分析好的数据存入存储系统。用户可以用网络舆情检索系统检索自己想要的最近、最新的焦点信息。最后通过舆情分析系统分析的信息、通过舆情检索系统检索的信息以及网络舆情存储系统中的信息都可以通过舆情报告系统发送和展示给用户。

3.网络舆情监测系统分析

3.1网络舆情采集系统

网络舆情采集系统是整个系统的基础。全世界互联网的信息是非常巨大的,即使仅仅对国内信息的检索也是海量的,而且由于网页设计的灵活性造成的网页结构复杂,网页的快速更新造成的网页内容动态性,以及一些网站对站内信息限制的技术手段造成网页内容不完整性,使得传统手工采集信息的方法非常低效率和高错误率。特别是最近几年,随着QQ群、博客、twitter等微博被网友广泛使用,这些主要为松散的,非结构化信息要实现采集的难度也越来越大,靠手工采集已经不太现实。

为解决这个问题,现在的采集系统往往采用具有一定智能的自动采集技术,国内外早期的网络采集方法是针对特定采集对象编写的程序,这个程序称为wrapper。近几年,越来越多的采集工具被开发出来用来代替传统的手工编写wrapper程序的方法。目前较为流行的采集工具可以分为六大类:

3.1.1开发wrapper的专用高级语言

传统的wrapper由于是手工编写针对某一个目标,如果要为大量目标手工编写非常不效率,通过专用高级语言可以方便编写wrapper。例如:Minerva,TSIMMIS,Web-OQL,FLORID,Jedi等。

3.1.2以HTML为中间件的工具(HTML-aware Tools)

这些工具在抽取时主要依赖HTML文档的内在结构特征。在抽取过程之前,这些工具先把文档转换成标签树;再根据标签树自动或半自动地抽取数据。代表工具有Knowlesys,MDR。

3.1.3基于NLP(Natural language processing)的工具(NLP-based Tools)

这些工具通常利用filtering、part-of-speech tagging、lexical semantic tagging等NLP技术建立短语和句子元素之间的关系,推导出抽取规则。这些工具比较适合于抽取那些包含符合文法的页面。代表工具有 RAPIER,SRV,WHISK。

3.1.4包装器的归纳工具(Wrapper Induction Tools)

包装器的归纳工具从一组训练样例中归纳出基于分隔符的抽取规则。这些工具和基于NLP的工具之间最大的差别在于:这些工具不依赖于语言约束,而是依赖于数据的格式化特征。这个特点决定了这些工具比基于NLP的工具更适合于抽取HTML文档。代表工具有:WIEN,SoftMealy,STALKER。

3.1.5基于模型的工具(Modeling-based Tools)

这些工具让用户通过图形界面,建立文档中其感兴趣的对象的结构模型,“教”工具学会如何识别文档中的对象,从而抽取出对象。代表工具有:NoDoSE,DEByE。

3.1.6基于本体的工具(Ontology-based Tools)

这些工具首先需要专家参与,人工建立某领域的知识库,然后工具基于知识库去做抽取操作。如果知识库具有足够的表达能力,那么抽取操作可以做到完全自动。而且由这些工具生成的包装器具有比较好的灵活性和适应性。代表工具有:BYU,X-tract。

3.2网络舆情分析系统

网络舆情分析系统为整个系统的核心功能,其主要包括以下功能:热点识别能力、聚类分析、倾向性分析与统计、信息自动摘要功能。

3.2.1热点识别能力

由于网络信息的更新和变化速度非常快,导致网络热点也时常转化,因此识别热点成为整个分析系统的前提条件。一般对于一段时间内的热门话题的识别主要是根据信息出处权威度、评论数量、发言时间密集程度等参数,给予一定的权重值,然后统计出该时间段内的热点。

3.2.2聚类分析

传统的手工统计分析对于海量的数据基本是无能为力,即使是勉强统计也会因为数据量而对数据的主题把握会产生偏差,从而造成统计数据失真,进而造成分析结果错误。

对文章标题和关键词进行聚类分析是现在常用的网络舆情分析方法,现在被广泛的采用,常用的聚类分析方法一般分为五类:

3.2.2.1划分方法

首先创建k个划分,k为要创建的划分个数;然后利用一个循环定位技术通过将对象从一个划分移到另一个划分来帮助改善划分质量。典型的划分方法包括:k-means,k-medoids,CLARA,CLARANS,FCM。

3.2.2.2层次方法

创建一个层次以分解给定的数据集。该方法可以分为自上而下(分解)和自下而上(合并)两种操作方式。为弥补分解与合并的不足,层次合并经常要与其它聚类方法相结合,如循环定位。典型的这类方法包括:BIRCH方法,它首先利用树的结构对对象集进行划分;然后再利用其它聚类方法对这些聚类进行优化。CURE方法,它利用固定数目代表对象来表示相应聚类;然后对各聚类按照指定量(向聚类中心)进行收缩。ROCK方法,它利用聚类间的连接进行聚类合并。CHEMALOEN方法,它则是在层次聚类时构造动态模型。

3.2.2.3基于密度的方法

根据密度完成对象的聚类。它根据对象周围的密度(如DBSCAN)不断增长聚类。典型的基于密度方法包括:DBSCAN:该算法通过不断生长足够高密度区域来进行聚类;它能从含有噪声的空间数据库中发现任意形状的聚类。此方法将一个聚类定义为一组“密度连接”的点集。OPTICS:并不明确产生一个聚类,而是为自动交互的聚类分析计算出一个增强聚类顺序。

3.2.2.4基于网格的方法

首先将对象空间划分为有限个单元以构成网格结构;然后利用网格结构完成聚类。STING就是一个利用网格单元保存的统计信息进行基于网格聚类的方法。CLIQUE和Wave-Cluster 则是一个将基于网格与基于密度相结合的方法。

3.2.2.5基于模型的方法

它假设每个聚类的模型并发现适合相应模型的数据。典型的基于模型方法包括:统计方法COBWEB:是一个常用的且简单的增量式概念聚类方法。它的输入对象是采用符号量(属性-值)对来加以描述的。采用分类树的形式来创建一个层次聚类。CLASSIT是COBWEB的另一个版本。它可以对连续取值属性进行增量式聚类。

3.2.3倾向性分析与统计

对信息的阐述的观点、主旨进行倾向性分析。可以为网络舆情的分析提供参考依据。

但是由于网络词汇的多样性,网络上出现许多新词,要判断这些词的倾向性就比较困难,一般倾向性分析可分为三种:

3.2.3.1情感倾向词典

中文词语情感倾向词典是给定一组已知极性的词语集合作为种子,对于一个情感倾向未知的新词,在电子词典中找到与该词语义相近、并且在种子集合中出现的若干个词,根据这几个种子词的极性对未知词的情感倾向进行推断。

3.2.3.2机器人学习

与词典法比较类似,也是给予一些已知极性的词语作为种子词,对于一个新词根据它和种子词的紧密程度对其情感倾向性进行推断,不同的是他是根据词语在种子库中的同现情况判断其联系紧密程度来作为判断依据。

3.2.3.3人工标注种子库

首先对情感倾向性分析种子库进行手工标注,标注的级别包括文档集的标注、短语级标注和分句级标注。在这些基础上,利用词语的共现关系、搭配关系或者语义关系,以判断词语的情感倾向性。

3.2.4信息自动摘要功能

能够根据文档内容自动抽取文档摘要信息,这些摘要能够准确代表文章内容主题和中心思想。用户无需查看全部文章内容,通过该智能摘要即可快速了解文章大意与核心内容,提高用户信息利用效率。而且该智能摘要可以根据用户需求调整不同长度,满足不同的需求。主要包括文本信息摘要与网页信息摘要两个方面。

3.3网络舆情检索系统

网络舆情检索分析系统产生的结果会实时存放进入存储系统之中,而检索系统可以分时间、地点、类型、网站等等进行分类检索,然后提供给用户。

分析系统提供的热点分析往往只是对已经产生的热点,或者是将要成为热点的次热点。而检索系统还可以让用户自定义关键词对采集到的信息进行自定义监控。

3.4网络舆情报告系统

根据网络舆情分析系统处理后的结果或网络舆情检索系统查询的结果生成报告,系统可通过短信、电话、网页浏览等各种手段及时告知,提供决策支持。

总之,网络舆情监测系统出现时间还比较短,基于其的算法和方法还都很不完善,而且随着计算机技术的不断发展,网络应用技术也在不断的变化,像近几年微博等非结构性的应用形式的出现,给检测系统的监测带来不小的挑战。方便、快捷、智能、通用将是今后舆情监测系统发展的方向。

参 考 文 献

[1]曹劲松.政府网络传播[M].江苏:江苏人民出版社,2010-11-02

[2]叶皓.正确应对网络事件[M].江苏:江苏人民出版社,2009

篇6:网络舆情监测系统

一、乐思网络舆情监控系统

乐思软件是一家致力于为国内外政府和企业用户提供互联网信息采集和网络舆情监测服务和系统软件的高科技公司。它专注网络信息采集和网络舆情监测9年,拥有自主研发的网络信息采集系统,在全球处于领先水平。在互联网海量信息精确监测与垂直挖掘领域拥有丰富的实践经验与领先优势。

它研发的网络舆情监测系统是针对向互联网这一新兴媒体,通过对海量网络舆论信息进行实时垃圾过滤、去重、相似性聚类、情感分析、提取摘要、自动聚类、自动发现热点、自动正负面判别等处理,生成舆情预警信息,及时通知到相关人员的一套信息化系统。系统可以对监测信息进行汇总、分析、总结,生成详细的舆情分析报告,为用户在舆情危机处置中正确的舆论导向及收集网友意见提供帮助和服务。它支持多种网页格式信息抓取监测,多种语言统一处理,文章智能提取,全网监测配置,信息抓取速度(最快达10秒以内)实现了信息监测的快准全。

二、军犬网络舆情监控系统

军犬网络舆情监控系统是一套综合运用搜索引擎技术、文本处理技术、知识管理方法、自然语言处理、手机短信平台,通过对互联网海量信息自动获取、提取、分类、聚类、主题监测、专题聚焦,以满

足用户对网络舆情监测和热点事件专题追踪等需求的舆情监控平台。

它由舆情采集工具、军犬网络信息采集系统、舆情加工和分析引擎、舆情服务平台、和舆情检索引擎、军犬智能检索系统四部分组成。采用B/S与C/S结构相结合的系统架构,利用先进的系统架构,形成了优势互补,实现了基于浏览器的廋客户端或者普通客户端、服务器模式。

三、Goonie网络舆情监控系统

它依托自主研发的搜索引擎技术和文本挖掘技术,通过网页内容的自动采集处理、敏感词过滤、智能聚类分类、主题检测、专题聚焦、统计分析,实现各单位对自己相关网络舆情监督管理的需要,最终形成舆情简报、舆情专报、分析报告、移动快报,为决策层全面掌握舆情动态做出正确舆论引导并提供分析依据。

它支持多种网页格式、多种字符集编码、整个互联网采集以及内容抽取识别技术,具有热点话题、敏感话题识别、舆情主题跟踪、自动摘要、舆情趋势分析、突发事件分析、舆情报警系统、舆情统计报告等多种功能。同时用户可以设定采集的栏目、URL、更新时间、扫描间隔等。系统的扫描间隔最小可以设置成1分钟,即每隔一分钟系统将自动扫描目标信息源,以便及时发现目标信息源的最新变化并以最快的速度采集到本地。

四、麦知讯第三方网络舆情监控系统

麦知讯是一家致力于向国内外行业用户提供互联网信息监测整体解决方案、业务发展信息咨询的高科技公司。它在资本运作和整合国内多家互联网信息专业公司、行业研究咨询公司的过程中不断成长,并通过合理地选择和应用成熟的互联网信息技术,使公司在原有业务的优势得到巩固的同时,也在新的业务领域取得了优异的成绩。

它的舆情监控内容包括口碑信息监测、企业、产品、品牌正负面口碑监测、竞品间的口碑对比监测、网络营销监测等。针对营销主题,提供点击数、回复数、回复时间、回复人、回复内容、回复语气、回复人感情倾向、正反向关注度、主题删帖率等监测服务、网络营销效果监测、搜索引擎呈现率、产品品牌知名度、用户关注度、好评率变化统计分析、网络营销咨询服务,为企业或公关公司提供网络营销方案或决策意见及建议等。

五、鹰隼网络舆情监控系统

本果公司在透析互联网特点、网民习惯和偏好基础上,充分运用自身搜索引擎技术、全文检索技术、相似性排重技术、自然语言智能处理技术、内容管理、互联网技术以及电子政务和电子商务软件开发优势,成功研发了鹰隼网络舆情监控系统。

它对舆情的处理按照信息采集、舆情过滤、自动分类、相似性排重、舆情分析、舆情展示的流程推进,整个系统由三部分组成:分别是信息采集子系统、舆情处理分析子系统和舆情管理子系统。它能够有效地搜索互联网上各层次各角落各形式的信息,深层次地挖掘网络

舆情价值,全天候并及时地提供最新网络舆情资讯、丰富翔实的信息、形象直观的图表、自动化的舆情预警,并递送网络舆情、舆情分析、统计数据、舆情报告。

六、红麦软件舆情监测系统

红麦聚信(北京)软件技术有限公司是国内权威的互联网数据挖掘、数据处理及互联网技术研发机构,公司依托互联网信息智能抓取技术和搜索引擎相关技术,自主研发拥有独立知识产权的网络舆情信息监测产品是国内权威的舆论情报信息监控平台。

篇7:网络舆情监测系统

随着网络舆情的重要性越来越凸显,政府和企业对舆情监测的需求不断上升,这推动了舆情监测市场进入高速成长期。看到这块不断做大的蛋糕,大批投机者纷纷进入舆情监测市场。截止2013年底,全国共涌现出800多家舆情软件企业,这个数量还在不断增长,预计2014年会突破2000家。由于互联网应用形式日新月异,对信息采集和分析的要求越来越高,很多舆情软件产品无法给用户带来有效的监测效果。目前,市面上95%以上的产品把精力花在界面展示上以迷惑客户,而对于具有难度的核心采集和分析技术缺乏热情去研究,导致行业还处在技术严重滞后、市场竞争激烈、质量良莠不齐的状况。在此,本文根据中国政府采购网、各地政府采购网以及部分媒体信息汇总,列出当前舆情监测市场最具影响力的十大舆情监测系统品牌,供各地政府企事业单位采购时参考:

Top1.拓尔思网络舆情监测系统。TRS公司是中文全文检索的创始者,在企业和互联网搜索、内容管理和文本挖掘等领域具有领先的技术和产品,在大中华地区拥有3000多家企业级用户,是非结构化信息处理技术领域的领导企业,也是中国最大的搜索技术和内容管理技术供应商。由于其起步较早,积累了大量高端客户,虽然每年的项目数量不多,但项目金额较大,在业界具有广泛的影响力。

Top2.快页舆情监测管理系统。快页舆情监测管理系统支持论坛、新闻、博客、贴吧、WAP网站和微博、QQ群、微信、元搜索等多种收集信息,实现全天候无遗漏监控。因此,对于互联网上传播的正、负面消息,都可以及时准确掌控,使您能在第一时间做出处理,维护贵单位(政府机关、部门单位、公司企业、医疗机构等)在社会中的良好形象。快页的优势在于其采集方式比较丰富,覆盖的媒体类似最多,其在华东市场具有较高的影响力。

Top3.本果舆情监测软件。本果舆情监测软件适用于公安、检察、司法、宣传等政府部门应用的网络舆情监测软件;并针对企业提供信息咨询和网络舆情监测服务。北京本果信息技术有限公司(简称“本果”)是全球中文信息监测领域的领衔企业,始终致力于网络舆情监测系统的研发、信息采集和数据挖掘技术的创新。2013,得益于网络推广,其销售额增长较快。

Top4.邦富互联网舆情监测系统。邦富舆情监控系统基于网页智能采集技术,可达到每5分钟更新一次的分钟级更新频率,同时目前系统可支持对上万个网站同时进行舆情采集与分析,采用了多线程并发指令执行体系结构、增量实时索引、智能分词、相关性分析和模糊匹配等多项先进技术。但该系统监测功能方面相对较弱,其在华南地区市场占有率较高。

Top5.军犬网络舆情监控系统。军犬舆情监控系统以强大的网络舆情信息采集、舆情智能分析与应对、舆情预警、舆情报告生成等16项核心功能组成,专业提供网络舆情监测、网络舆情监控服务。舆情监测也是其主要业务,也有很强的专业性。其从事舆情行业较早,产品架构较老,采集以C/S方式,管理以B/S方式,部署较复杂。

Top6.谷尼舆情监测系统。谷尼互联网舆情监控系统是一套利用采集检索技术、文本挖掘技术、知识管理方法,通过对互联网海量舆情信息自动获取、抽取、分类、聚类、溯源等,最终形成舆情预警、舆情简报、舆情专报、分析报告、传播路径、舆情溯源等舆情产品,为客户全面掌握舆情动态,做出正确舆论引导提供分析依据。

Top7.红麦舆情监测系统。系统利用自有爬虫技术,根据预定的监控关键词抓取重点媒体、论坛、博客、微博等网站里的舆情信息,并对危机信息及时报警。系统利用分类、去重、相似性聚类、情感分析、提取摘要、自动聚类等处理,配合专业分析师生成详细的舆情分析报告,提供舆情监测预警作用。

Top8.西盈网络舆情监测系统。西盈舆情监测系统及时发现与“我”相关的舆情信息,负面信息、重大舆情及时预警;提供定性定量的舆情研判分析,准确研判具体舆情或者某一舆情专题的发展变化趋势;自动生成舆情报告和各种统计数据,提高舆情工作的质量和效率,辅助领导决策; Top9.美亚舆情监测系统。该系统主要依托其“搜索云平台“,即云计算中心数据可,提供的在线SaaS软件服务的服务型平台。用户无需购置和建设专用系统,无需安排专人运维管理,只需购买美亚柏科专业的”搜索云平台"服务,即可方便在不同的终端上查看专为您定制的最新的舆情信息。他们在用户自建舆情监测平台方面较弱。美亚长期在公安行业耕耘,具有一定的行业优势。

篇8:网络舆情监测系统

关键词:网络舆情,政府,大数据

网络舆情 (Internet Public Opinion, IPO) 即网络上的社情民意[1], 其概念强调两点:一是新闻事件、社会现象和社会问题主要通过互联网首发或传播, 二是表达信念、态度、意见和情绪的公众主要是网民。从上世纪九十年代开始, 互联网的飞速发展已经深刻的改变了社会的信息传播渠道;如今普及的移动互联网更是彻底颠覆了传统的媒体和舆论观念, 成就了一个“人人都是信息采集者、人人都是信息传播者”的新时代。网络媒体具有进入门槛低、信息规模大、发布与传播迅速、参与群体庞大、实时交互强等综合特点。网络舆论不仅是网民直接表达意见的渠道, 更是网民与社会管理者进行互动的绝佳平台, 甚至已经开始推动社会在各个领域的变革和进步。

1 大数据时代网络舆情监测的新机遇

社交媒体和传感网络的发展带来数据爆炸式增长催生了大数据 (Big Data) [2]这一新兴概念。大数据所涉及的资料规模如此巨大, 以至于几乎无法通过目前的主流软件工具, 在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策目的的信息。大数据的数据规模超出传统数据库软件采集、存储、管理和分析等能力的范畴, 涉及到多种数据源、多种数据种类和格式。网络舆情信息正是一种大数据, 达到甚至超过PB (1000TB) 级规模的网络言论事实上代表了网民最真实、最客观的行为特征与心理需求。网络舆情信息的主要来源有:新闻评论、BBS、聊天室、聚合新闻RSS、QQ、MSN、博客、微博和微信等等。传统的依靠人工的方法进行的网络舆情监测在大数据时代显然难以持续。如何时准确地掌握网络舆情动态, 提高新形势下舆情信息的分析能力, 积极引导社会舆论是各级政府部门面临的严肃课题与严峻挑战。

大数据的基本特征可以从规模、变化频度、种类和价值密度等几个方面进行理解。对于大数据特征的描述集中为5V, 即规模化 (Volume) 、多样化 (Variety) 、快速化 (Velocity) 、潜藏价值 (Value) 以及真实性 (Veracity) 。

规模化 (Volume) :聚合在一起供分析的数据规模非常庞大。谷歌执行董事长艾瑞特·施密特曾说, 现在全球每两天创造的数据规模等同于从人类文明至2003年间产生的数据量的总和。“大”是相对而言的概念, 对于搜索引擎, EB (1000PB) 属于比较大的规模, 但是对于各类数据库或数据分析软件而言, 其规模量级会有比较大的差别。

多样化 (Variety) :数据形态多样, 从生成类型上分为交易数据、交互数据、传感数据;从数据来源上分为社交媒体、传感器数据、系统数据;从数据格式上分为文本、图片、音频、视频、光谱等;从数据关系上分为结构化、非结构化、半结构化数据;从数据所有者分为公司数据、政府数据、社会数据等。

快速化 (Velocity) :一方面是数据的增长速度快, 另一方面是对数据访问、处理、交付等速度的要求快。美国的马丁·希尔伯特说, 数字数据储量每3年就会翻1倍。人类存储信息的速度比世界经济的增长速度快4倍。

潜藏价值 (Value) :尽管我们拥有大量数据, 但是发挥价值的仅是其中非常小的部分。大数据背后潜藏的价值非常巨大。美国社交网站Facebook有10亿用户, 网站对这些用户信息进行分析后, 广告商可根据结果精准投放广告。对广告商而言, 10亿用户的数据价值上千亿美元。2012年, 运用大数据的世界贸易额已达60亿美元。2016年, 这个数字预计将达200亿美元。

真实性 (Veracity) :一方面, 对于虚拟网络环境下如此大量的数据需要采取措施确保其真实性, 客观性, 这是大数据技术与业务发展的迫切需求;另一方面, 通过大数据的分析, 真实地还原和预测事物的本来面目或者是未来的发展趋势也是大数据发展的关键问题。

2 政府网络舆情监测系统的建设需求与目标

政府网络舆情监测系统建设的实际需求有:

(1) 如何透过互联网了解民情, 获取最真实的民众诉求?

(2) 如何准确地收集“政府各部门最需要的”舆情信息?

(3) 如何能随时知道“与政府各部门相关舆情信息”的发生, 以及如何全面追踪?

(4) 如何应对突发事件和舆情危机?

(5) 如何防止有害舆情信息的泛滥传播和舆情失控?

(6) 如何判断舆情信息的未来走势?

(7) 如何在第一时间为政府各部门领导决策提供信息支持, 为危机化解争取时间?

(8) 如何建立舆情评估机制?

因此政府网络舆情监测系统的建设的目标是:

借助大数据支撑技术, 通过对主流媒体、门户网站、资讯平台、知名论坛、搜索引擎、博客、贴吧等网络载体的监测, 全面掌控互联网上与政府各部门相关的人、地、物、事、组织, 不漏掉有价值的舆情信息。借助大数据支撑技术, 对已经获取到的海量网络信息中与政府各部门相关的舆情信息进行动态分类采集、智能化分析, 及时发现隐藏热点舆情、突发事件和重大公共事件信息。借助大数据支撑技术, 实现第一时间掌握涉及政府各部门相关的网络舆情最新动态。

3 政府网络舆情监测系统“云平台”构建

3.1 舆情系统总体架构

政府网络舆情监测系统“云平台”总体架构如图1所示。

政府网络舆情监测系统“云平台”通过虚拟化技术[3], 在物理服务器的基础上搭建若干虚拟机, 部署相应的应用服务器、数据库服务器, 并基于NAS[4]、IP SAN[5]、FC SAN[6]等技术构建虚拟化存储体系, 在云端存储所有的应用数据。通过云平台管理套件实现虚拟服务器、存储资源的定制化、可计数、动态分配和使用, 并在“云平台”的基础上搭建网络舆情监测系统应用。

3.1.1 基础资源服务 (IAAS)

在电子政务专网、服务器、存储设备等IT基础设施的基础上构建政府网络舆情监测系统“云平台”的基础资源服务, 包括:虚拟服务器、虚拟存储等。

虚拟服务器:在物理服务器上安装虚拟机管理程序 (Virtua Machine Monitor) , 虚拟机管理程序可根据用户实际需求 (CPU主频、内存大小、硬盘容量等) 构建相应的虚拟服务器作为部署应用系统的应用服务器和数据库服务器。

虚拟存储:通过成熟的NAS、IP SAN、FC SAN技术构建集群的云端存储体系, 为各个虚拟应用服务器和数据库服务器提供存储。

3.1.2 平台即服务 (PAAS)

通过“云平台”管理程序对虚拟机的创建、负载均衡、回收、备份进行统一的管理, 并提供相应的技术组件为“云平台”上的应用提供支撑。政府网络舆情监测系统通过PAAS层向用户提供舆情监测相关的功能服务。PAAS层是为上层服务提供技术支持的组件和数据库服务, 支持组件包括网页爬虫组件、搜索引擎、存储管理、舆情分析组件、全文检索组件、应用中间件、日志服务、系统安全管理等组件。

大数据中心包括用户数据库、舆情采集数据库、舆情分析数据库、监狱信息数据库等等, 基于以上各类数据, 包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音视频信息等等结构化、非结构化、半结构化数据, 由于结构和来源不同, 系统提供了不同的访问方式和相关协议标准。

3.1.3 软件即服务 (SAAS)

软件即服务 (SAAS) 是在基础资源服务 (IAAS) 和平台服务 (PAAS) 的架构基础上, 为政府用户提供提供网络舆情应用服务, 主要通过舆情采集、舆情处理分析、舆情管理三大子系统提供。

3.2 舆情系统部署

政府网络舆情监测系统可以按省、市县等层级实施部署。通过电子政务专网, 将政府各部门有机连接, 共建舆情大数据与预警中心, 整个网络拓扑架构如图2所示。省级系统和市县级系统分别独立, 上级主管部门可以访问下级采集的数据, 如果达成协议, 同级各部门也可以互相共享采集回来的数据。

4 结语

网络舆情已成为影响社会持续有序发展、维护社会和谐稳定的重要因素, 政府各部门有必要高度重视网络舆情监测系统的建设积极应对大数据环境下互联网信息内容的管理、信息基础设施的保护, 通过网络舆情的监管和引导, 依法治理网络空间, 维护公民合法权益。

参考文献

[1]法制网舆情监测中心.政法舆情危机应对实务手册[M].北京:经济管理出版社, 2013.

[2]维克托·迈尔·舍恩伯格.大数据时代[M].浙江:浙江人民出版社, 2012.

[3]虚拟化技术.http://baike.baidu.com/view/13605.htm.

[4]NAS.http://baike.baidu.com/subview/56335/7913805.htm.

[5]IP SAN.http://baike.baidu.com/view/1810605.htm.

上一篇:造价工程师考前模拟试题及答案解析下一篇:在急流中教案