中国大数据应用大会

2022-09-08

第一篇:中国大数据应用大会

大数据的商业应用

对大数据的开放和应用将对社会、 商业和个人都产生巨大而深远的影响。 目前我们已经观察到或者可以预测到的影响包括但不仅限于以下几个方面。

第一,围绕大数据的应用将激发前所未有的创新浪潮。社交网络的流行和物联网的建设使得对个体和群体(无论是人或物)的实时观察和了解正在逐渐成为可能,这为预测群体行为和了解个体偏好提供了强有力的工具。利用大数据这一特性的应用已经在多个领域展现其惊人的威力和创新能力。

第二,大数据的开放将极大地提升社会的公开透明度和提高政策制定的效率。一方面,多种类型数据的公开大大提升了政府的透明度,通过公众的监督提高民主程度。另一方面,通过为大众提供创新的平台,充分汲取群体的智慧,有效榨取数据的可利用价值,反过来可以提升社会效率和政府效率。

第三,随着大数据时代的来临和深化,在商业、经济及其他领域中,决策行为将日益基于数据和分析而做出,而并非基于经验和直觉。伴随着数据的大量累积和数据处理能力的不断提升,利用数据来进行判断和预测的能力将会得到无限的放大,数据将引领社会前进的方向。第四,个人成为大数据链条中不可或缺的一环,而对数据的依赖将改变人类的生活方式。

对银行的影响

(一)大数据提供了全新的沟通渠道和营销手段

一方面,社交媒体的兴起给银行提供了全新的与客户接触的渠道。已经有多家银行开通了官方微博,通过树立社会化的形象,拉近与客户之间的距离,利用社交媒体的力量,往往能够取得意想不到的效果。光大银行在2011年4月份通过其官方微博发起了“95595酒窝哦酒窝——光大电子银行酒窝传递活动”,向网民征集酒窝照片, 并由参与者向好友进行传递, 征集的照片会组成一个笑容墙展示,一个月的时间里有超过740000人参与了活动,使得光大银行的客服电话号码一夜走红。

另一方面, 通过打通银行内部数据和外部社会化的数据可以获得更为完整的客户拼图,从而进行更为精准的营销和管理。银行本身拥有客户的大量数据,通过对数据的分析可以获得很多信息,从而成为进行管理和营销的依据。但由于银行拥有的客户信息并不全面,这种分析有时候难以得出理想的结果甚至有可能得出错误的结论。比如说,如果某位信用卡客户月均刷卡6次,平均每次刷卡金额500元,平均每年打3次客服电话,从未有过投诉,按照传统的数据分析,该客户是一位满意度较高、流失风险较低的客户。但如果看到该客户的微博,得到的真实情况是:工资卡和信用卡不在同一家银行,还款不方便,好几次打客服电话没接通,客户多次在微博上抱怨,该客户流失风险较高。

(二)大数据滋生了新型金融业态参与市场竞争

大量的数据来源和强大的数据分析工具正催生出很多新的金融业态来直接瓜分银行的信贷市场。在英国,一家叫做Wonga的公司利用海量数据挖掘算法来做贷款业务,他们大量使用社交媒体和其他网络工具,将客户的信息碎片关联起来,预测客户的违约风险,为其信贷业务提供依据。在中国,阿里巴巴旗下的阿里信贷自2012年8月起全面向普通会员开放, 提供无抵押、无担保的低额贷款。而其依仗的正是掌握在手中的海量客户经营数据,有了这些数据,阿里巴巴可以说是对客户的资信状况了如指掌,从而最大程度地降低了信贷业务的风险。如果说像Wonga这种需要去网络上搜集数据来进行放贷的公司尚不足为惧,那么像阿里巴巴这种本身拥有雄厚客户基础和海量数据资产的公司介入信贷行业,将对行业格局产生深远的影响。“网络融资”可能成为 20 年后的主流,甚至可能发展到资金供需信息直接在网上发布并匹配,供需双方直接完成资金融通。

(三)利用数据的能力日益成为银行竞争的关键

麦肯锡在其研报中分析了不同行业从大数据浪潮中获利的可能,金融行业拔得头筹。作为金融行业的主要组成部分,银行业利用数据来提升竞争能力具有得天独厚的条件。

第一,银行业天然拥有大量的客户数据和交易数据,这是一笔巨大的财富。 第二,银行业面临的客户群体足够大,能够得出具有指导意义的统计结论。

第三,在“小数据”时代,银行业已经在以信用评级模型和市场营销模型为代表的数据分析上积累了大量的实战经验,具备向“大数据”分析跨越的基础。随着“大数据”时代的来临,银行运用科学分析手段对海量数据进行分析和挖掘, 可以更好地了解客户的消费习惯和行为特征,分析优化运营流程,提高风险模型的精确度,研究和预测市场营销和公关活动的效果,从每一个经营环节中挖掘数据的价值,从而进入全新的科学分析和决策时代。在这种情况之下,利用大数据的能力将成为决定银行竞争力的关键因素。

(四)从长远看大数据将全面颠覆金融服务形态

从长远来看,随着数据化和网络化的全面深入发展,金融服务将向虚拟化方向发展,从而全面颠覆金融服务形态。一是产品的虚拟化,资金流将越来越多地体现为数据信号的交换,电子货币等数字化金融产品的发展空间巨大。 二是服务的虚拟化通过移动互联网、全息仿真技术等科技手段,银行完全可以通过完全虚拟的渠道向客户提供业务服务,现有的实体柜面可能趋于消亡。三是流程的虚拟化,银行业务流程中各类单据、凭证等将以数字文件的形式出现,通过网络进行处理,从而提高处理的便利性和效率。在这样的服务形态下,银行的整体运作就是一个数据的洪流,“数字金融”得以全面实现,银行的管理理念和运营方式也随之得以全面颠覆。

银行的发展方向

(一)促进金融服务与社交网络的融合

商业银行要打破传统数据源的边界,更加注重社交媒体等新型数据来源,通过各种渠道获取尽可能多的客户信息,并从这些数据中挖掘出更多的价值。

一是整合新的客户接触渠道,充分利用社交网络的作用,增强对客户的了解和互动,树立良好的品牌形象。

二是注重新媒体客服的发展,利用论坛、聊天工具、微博、博客等网络工具将其打造成为与电话客服并行的重要服务渠道。

三是将银行内部数据和外部社交数据互联,获得更加完整的客户视图,从而进行更为高效的客户关系管理。

四是创造性利用社交网络数据和移动数据等进行产品创新和精准营销。比如,当银行通过客户的移动定位信息知道该客户正在某商场购物,便自动发送关于该商场的某餐馆的刷卡促销活动的短信;设计新产品的时候在网络上征求客户意见,激发客户参与的热情,在了解客户需求的同时达到良好的宣传效果。

五是注重新媒体渠道的舆情监测,在风险事件爆发之前就进行及时有效的处置,将负面影响降至最低。

实现金融服务与社交网络的融合存在一些现实的困难,只能通过不断摸索的方式前进。 首先,银行难以得知客户在社交网络上的用户名,也就难以进行数据整合。可以考虑进行一些针对性的市场活动来收集客户的用户名,或者在将来的客户申请表上添加社交网络用户名的选项。也可以考虑和社交网络进行直接的合作,在实名制的社交网络上,可以利用客户的官方证件号码来实现客户信息的对接。

其次,目前尚缺乏成熟有效的非结构化数据的处理工具。在初期可以采取半人工的方式进行处理。IT业投入在非结构化数据处理工具的研发力量非常强,相信不久的将来就能够有相对成熟的分析工具问世。

第三,目前在银行庞大的客户群体中,热衷于新媒体的毕竟只是一部分。如果凭借对他们的分析来制定针对全体客户的策略,统计样本的偏差可能会导致策略的失效。因此暂时只能用于制定一些针对特定客户群体的策略。 随着出生在网络年代的年青一代的成长,这样的偏差会越来越小,最终将能覆盖几乎全部的客户群体。

第四,金融服务对系统安全性和稳定性的要求都远高于社交平台,在实现服务对接的时候可能会影响用户体验。最后,在诸如客户的定位信息之类的数据是否属于隐私,如何使用方面还存在许多法律上的空白。这些问题都有待各行业协调解决。

(二)布局与大数据金融的竞争和合作

这里所说的“大数据金融” 特指类似于阿里信贷这种基于大数据的金融服务商。随着大数据金融的发展,银行与他们的竞争和合作不可避免。一方面,银行可以通过发展自己的大数据平台与其开展直接竞争。在当前的各大电商平台上,每天都有大量的交易发生,但是这些交易的支付结算大多被第三方支付机构垄断,银行处于支付链条的末端,获取的价值非常小。大数据金融的核心竞争力在于其拥有的大量客户经营数据, 银行在其产业链中的影响力很小,这也是阿里巴巴可以终止与建行的合作自行开展信贷业务的原因。为应对这种局面,银行可以考虑自行搭建大数据平台,获取属于自己的大数据,将核心话语权牢牢掌握在自己的手中。事实上,已经有不少银行开始了这方面的布局。2012年6月28日,建行的电子商务平台“善融商务”正式上线,包括B2B和B2C,业务范围包括电子商务服务、金融服务、营运管理服务、企业社区服务及企业和个人商城。这可以看作是建行对于阿里巴巴终止合作的直接应对。 交行打造的电子商务平台“交博汇” 也开始向客户开放。在为客户提供增值服务的同时获得客户的动态经营信息,成为银行共同的驱动力。

另一方面,银行需要与大数据金融企业加强合作互利。完整和综合的大数据注定难以被某一家企业、机构或政府部门所独自掌控, 因此任何想垄断大数据的想法和行为都是不现实的,企业之间的合作互赢是发展的潮流。 在认同大数据巨大价值的共识下,银行可与电信、电商、社交网络等大数据平台开展合作, 进行数据和信息的共享和利用, 全面整合客户有效信息, 将金融服务与移动网络、电子商务、社交网络等完美融合。建行与阿里巴巴的信贷合作可以说是在这方面进行了非常有益的探索, 可惜由于阿里巴巴要求在信贷利息中分利被拒绝而导致合作终止。但由此可见建立银行与电信运营商、电商、社交网络等参与方的合理的利润分配模式是否合理是合作能否成功的关键因素。

(三)培养面对大数据时代的核心能力 一是数据整合的能力。不仅仅是银行内部数据的整合,更重要的是和大数据链条上其他外部数据整合的能力。大数据时代,有能力整合和管理数据的企业才能够主导产业链,作为大数据链条中的一环,银行应当以更加积极的姿态与链条上的其他企业进行数据和信息的交换,越是完整的数据,能够产生的作用就越大。由于各行业的数据标准和格式存在差异,如何逐渐统一数据标准以便进行更方便的数据交换和融合是当前面临的巨大挑战。

二是数据分析的能力。这里要注意区分传统的商业智能和大数据时代的数据分析能力。首先,传统的商业智能所处理的数据大多都是银行自身数据库当中的标准化、结构化的数据,而在大数据时代,更多需要处理的是大量的半结构化和非结构化的数据。其次,大数据时代处理的数据量与现在完全不在一个量级,现有的很多数据处理方法已经不能满足需求。最后,当前银行中常用的数据分析比如信用评级和市场营销模型,都是在建模后再进行系统实施,持续的时间较长。而在大数据时代,对于数据处理的实时性有很高的要求。这些本质上的区别不仅要求银行使用专门的数据储存技术和设备,更要求采用专门的数据分析方法和使用体系。不得不说的是,中资银行在对数据分析的重视程度和能力上与国际先进银行有着巨大的差距,很多中资银行在“小数据”时代的数据分析能力都亟需加强。

三是行动实施的能力。任何对大数据的分析只有转换为实际的商业行动才能够真正为银行创造价值。大数据时代的行动实施具有两个鲜明的特点:精准和快速。精准取决于大数据时代对客户的全面深刻了解,制定的行动方案都非常具有针对性,因此方案将会更加差异化。现在给全体客户统一版本发送的一条促销短信在将来可能需要发送上万个不同的版本。快速取决于大数据时代很多分析和策略都是系统自动完成的特性,更多的营销活动都将由客户的某项行为触发,然后由系统自动执行相应的行动。这些特性对银行的系统和人员都提出了更高的能力要求。

第二篇:大数据的海关应用

大数据是一个相当热门的词。所谓的大数据技术指的数据分析的前沿技术。简言之,大数据技术就是一种从海量数据中快速获得有价值信息的能力。对于“大数据”(Big data),研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。上海腾道

作为一项重要的技术革新,大数据技术具有以下几方面特点:一是数据基础必须具备海量特性;二是可以根据设定好的管理或经营目标反向寻找管理中实际存在的关键节点和核心环节;三是数据重新梳理有助于提升决策力和修正决策方案、使既有信息资产爆发更大价值。而这几方面的特点,与海关审计工作的各项需求是相契合的,海关当前林林总总的信息系统的建设,也为运用大数据技术实现审计信息化奠定了良好的基础。

那么对于海关来说这些大数据有着什么样的作用?

1.拓展基础数据资源

一是丰富海关执法相关领域基础数据源,打破部门之间存在数据壁垒,实现海关缉私行政执法数据、稽查数据、监管场所信息、口岸单位数据等的关联比对,尤其要打破目前各关区和海关各业务系统之间的数据壁垒,实现信息互联互通。二是海关预算和财务管理方面,引入海关通用财务管理、固定资产管理等现有信息系统的基础数据,打破现有系统之间数据分散、相互独立、无法互通的现状,实现“财”与“物”的联动比对,实现海关所有信息系统之间数据的对碰分析。三是推动海关有关部门进一步加大对物资采购、基建修缮等领域信息系统的开发建设,为实现财务管理、政府采购、基建修缮、资产管理的横向联动分析以及海关总署-直属海关-隶属海关三级纵向联动分析奠定基础。

2.完善现有海关系统

以海关执法廉政风险预警处置系统为依托整合优化执法领域审计数据分析平台,在充分利用现有系统数据资源和监控功能的基础上,开发定制部分海关审计监控指标,完善构建按照不同系统用户形成涵盖全国海关数据指标集中展示和预警模块。同时引入大数据思维,开发适应海关常规审计和经济责任审计实践需要的功能,一方面突出对被审计单位贯彻落实海关总署党组重大决策、重要政策执行、业务发展动态和变化趋势的整体分析把握,更突出对执法统一性、自由裁量权规制、高风险节点指标等落实情况的监控。另一方面,要充分应用结构分析、多维分析、挖掘分析等分析方法,开展海关横向区域间对比分析、跨业务领域数据结合分析和纵向历史趋势分析,为有效发现系统性、区域性风险提供数据支撑。

3.外购公认的优秀大数据服务

先进的分析技术和大数据工具的进步神速,它们正以前所未有的方式帮助用户获取新的统计角度和结果。Tableau、Qlikview和NoSQL等工具和平台迅速崛起带来了全新的分析视角和机会,基于成熟的分析、视觉化以及数据管理的全新生态系统也以日新月异的速度改变着信息使用者的分析能力。可提供这类工具的供应商不胜枚举,开放资源的开发商数量更是不计其数。作为海关审计的大数据建设,应该不仅仅局限于海关自身的技术开发力量,更为重要的是学会怎么利用现有的比较成熟的数据采集和挖掘手段,以降低成本,提升海关审计监督效益。

第三篇:大数据应用实例分析

电信运营商的阳关大道

——大数据应用实例分析

09012208

黄文婷

摘要:

随着全球数据化、网络宽带化,基本的数据量越来越大,由此我们进入了大数据时代。本文探讨了大数据内涵与意义,从电信行业这一大数据应用实例进行分析,介绍了大数据在电信行业的应用、必要性及相关措施。

关键词:大数据

电信

应用

正文:

一、大数据的内涵与意义

(一)大数据的意义

大数据和云计算一样,近两年来越来越多的受到人们的关注。那么什么是大数据呢? 大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中,大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法) 对于“大数据”(Big data),研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

(二)大数据的特性

大数据有4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、veracity(真实性)。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。包括网络日志、视频、图片、地理位置信息等等。第三,数据的来源,直接导致分析结果的准确性和真实性。若数据来源是完整的并且真实,最终的分析结果以及决定将更加准确。第四,处理速度快,1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”。

(三)大数据的应用意义

大数据最核心的价值就是在于对于海量数据进行存储和分析。相比起现有的其他技术而言,大数据的“廉价、迅速、优化”这三方面的综合成本是最优的。

此外,大数据的潮流虽然依赖于信息通信技术的成熟,但它对整个世界的影响绝不仅限于技术层次。它借助信息技术的创新与发展,及数据的全面感知、收集、分析与共用,引导我们以全新的思维看待世界,养成决策思维行为须根据事实与数据的分析判断,舍去凭借经验和直觉的习惯作风。可预见,它将对惯于“差不多”的思维造成巨大的冲击。

很多人一提到大数据,就会不由自主想到那个关于啤酒和尿布的经典案例。事实上,随着移动互联网、智能终端、云计算、物联网技术以及电子商务、社交媒体等应用的飞速发展,大数据已经越来越多的渗透到生活方方面面,宣告着我们已经进入了信息爆炸的大数据时代。电信运营商历经语音、短信、数据三个发展浪潮,积累了大量如文本信息、音频、视频、图片等非结构化数据,在大数据时代无异于拥有了一条发展的阳关大道。而机智的电信运营商也致力于研究如何在这条道路上比别人跑得更快以获得更多的利益。

二、大数据在电信行业的应用

(一)电信行业大数据应用的四个方向

现阶段电信运营商利用其拥有的大数据进行全面、深入、实时的分析和应用,是应对新形势下的挑战、避免运营商沦为管道化的关键。从大数据的具体应用方向来看,当前应主要集中在四个方向:流量经营精细化、智能客服中心建设、基于个性化服务的客户体验提升以及对外数据服务。

1.流量经营精细化

在流量经营精细化上,大数据应用的价值主要体现在深入洞察客户、助力精准营销和指导网络优化三个方面。首先,基于客户终端信息、手机上网行为轨迹等丰富的数据,借助DPI (Deep Packet Inspection,深度数据包检测)技术等,建立客户超级细分模型,为各细分群组客户打上互联网行为标签,可以帮助运营商完善客户的360度画像,帮助运营商深入了解客户行为偏好和需求特征;其次,根据用户行为偏好,推送合适的业务,并根据对客户特征的深入理解,建立客户与业务、资费套餐、终端类型、在用网络的精准匹配,同时也能做到在推送渠道、推送时机、推送方式上满足客户的个性化需求,实现全程精准营销;再次,利用大数据技术实时采集处理网络信令数据、监控网络状况、识别价值小区和业务热点小区,更精准地指导网络优化,实现网络、应用和用户的智能指配。 2.智能客服中心建设

作为运营商与客户接触的第一界面,客服中心(或称客户联络中心)拥有丰富的数据资源,可以称得上是客户信息的“聚宝盆”,利用好客服中心的客户接触数据对于建设智能化客服中心意义重大。利用大数据技术可以深入分析客服热线呼入客户IVR(Interactive Voice Response,互动式语音应答)行为特征、访问路径、等候时长等;同时结合客户历史接触信息、基本属性等可以建立热线呼入客户的智能识别模型;基于客户智能识别模型可以在某类客户下次呼入前预先推测其呼入的需求大体是什么,IVR接入后应该走什么样的节点和处理流程。这样,就可以基于呼入客户习惯与需求的事先预测而设计按键菜单、访问路径和处理流程,合理控制人工处理量,缩短梳理时限,为客户服务中心内部流程优化提供数据支撑,有助于提升热线服务管理水平,加速热线营销渠道资源整合,有效识别客户投诉风险,助力智能客服中心的建设。

3.基于个性化服务的客户体验提升

大数据时代对于运营商为客户提供服务来说更加侧重于“小”,即更加关注每个个体“小我”的个性化需求,而融合了电商、医疗、社交等方面信息的“大”数据正是为了更深入的理解“小我”、服务好“小我”。利用大数据技术,一方面可以建立更全面、丰满的客户画像,另一方面还可以量化分解客户接触信息,识别客户特征与习惯偏好,预测客户可能在何时手机会出现故障、何时会产生换机行为等,为客户提供定制化的服务,优化产品、套餐和定价机制,实现“一户一策”的差异化、个性化服务,提升客户体验与感知。由此可见,大数据将为移动互联网时代的客户服务带来一次变革,给客户服务带来极大的想象空间和无限的发展前景。 4.对外数据服务

对外数据服务是大数据应用的高级阶段,这个阶段电信运营商不再局限于利用大数据来提升内部管理效益,而是更加注重数据资产的平台化运营。利用大数据资产优势,将数据封装成服务,提供给相关行业的企业用户,为合作伙伴提供数据分析开放能力。例如,Telefonica和Verizon已经成立专业化数据公司来运作对外数据售卖的服务。再如,如果将无线城市与物联网、电子政务等方面的信息结合起来,将能为电信运营商的数据和政府的政务数据增值,对于打造一个开放数据平台和民生服务平台有重大意义。让数据在不同行业之间流动起来,实现体外循环将能进一步释放数据的价值。当然,以简单的Data Seller模式售卖数据服务时,需要 注意保护客户隐私、打消隐私顾虑。

(二)电信行业大数据应用的效益

网络上的每笔搜索,网站上的每笔交易,敲打键盘、点击滑鼠的每一个动作,都在输入数据,经过整理分析后,它可能显示市场的脉络、甚至更具商业价值的开发着力点。曾有统计,运用大数据的分析,可以让公司增加50%的新客户,让政府减少30%的成本。这些如海潮般涌入的大量资料,正是云端时代的新金脉,已经创造出惊人的效益。

三、大数据在电信行业应用的必要性与措施

电信运营商拥有大量的数据资源,如网络信息、用户终端信息、用户位置信息等,只要对电信网络有深刻的理解和技术积累,具有敏锐的行业发展嗅觉和强大的产业研发能力,基于大数据进行深度挖掘分析,将丰富的网络、用户等数据资源加工抽取后封装为服务,将数据资源在一定程度上货币化,向大客户提供增值服务,就能增加新的盈利模式。这无疑是电信运营商发展盈利的一条阳关大道。

面向大数据时代,运营商的及时转型成为必然,否则将有被互联网企业超越的可能性。理论上讲,运营商拥有颇具优势的大数据资源并不是完全不可替代,例如,用户的位置信息就可以通过多种APP应用获得,用户的网络使用信息也可以通过多家互联网企业合作获取,互联网企业通过泛互联网化收集更多的大数据信息。另一方面,多行业的垂直整合将成为趋势,在数据应用层面,行业企业通过多种手段搜集大量的用户数据,将更贴近用户,更理解用户,为其提供更适当的服务,大数据将成为资产更具有战略意义,各个行业及单位都在关注大数据。

根据大数据数量大、时效性要求高、数据种类及来源多样化等特征,运营商首先获取更多有用的大数据资源,例如,很多的网络运行信息,包含大量有价值的用户行为和位置信息,这样的信息可以加以利用。有了资源应该加以利用,避免大数据资源的浪费。事实上,一些运营商拥有大数据这样的金山,却似乎无奈坐看并逐渐沦为管道,在不断强化传统市场的效益考核,却好像在忽视大数据价值的流失。

大数据在电信行业应用措施主要有三个方面:

1)梳理并整合业务部门对大数据的需求,立足分析需求,做好大数据的IT体系构架的规划。大数据相关技术条件的成熟、大数据分析能力及分析应用经验的积累等多方面因素,都是制约企业建设的建设IT系统的条件,要充分抓住大数据带来的机会并避免“心急吃不了热豆腐,反被热豆腐伤害”的问题。

2)落实基于品质管理资料的经营新模式。面对大数据时代的趋势潮流,学会既然无从抗拒,就积极响应,以共享大数据带来的潜在效益。

3)以职能部门提供整体IT支撑方式向嵌入业务流程实时数据的分散能力支撑方式转变。这种转变趋势又称IT支撑“消费化”趋势。在大数据时代,数据从支撑企业中高层运营管理决策普及到支撑企业的产品运营、市场运营、客户服务,甚至在智能管道运营全流程中涉及从企业中高层运营管理人员到基层生产执行人员,很明显,这种数据获取和分析能力如果集中在IT职能部门,而不是全体人员均结合自身业务需求而具备的话,大数据分析驱动的各项运营管理应用即成为不可能的任务。

四、结语 从电脑技术的演进来说,“大数据”是既资料探勘、云端计算之后一项革命性的趋势发展。庞大的数据资源迫使各个领域的运作造成量化的质变,目前全世界无论是学术界、企业界、产业界甚至是政府单位都在积极研究大数据分析。在这种背景下,电信行业也结合自身特征,进行相关的研究与应用,奔跑在大数据铺就的阳关大道上,成为激烈竞争中的新赢家。

参考文献:

[1]黄小刚.电信行业大数据应用的四个方向.业务与运营.2013(6):26-28 [2]季鸿,张秀凤,柴林麟.大数据在电信行业的应用展望.通信企业管理.2014(1):76-77 [3]卢云许.电信行业大数据应用浅析.信息工程系统.2013(12):29-30 [4]潘海鹏.浅谈电信行业大数据的意义与应用.电子世界.2014(3):21-23 [5]史斌,周双阳.电信行业如何应用大数据.新引擎.2013(7):47

第四篇:大数据在智慧城市的10大应用

大数据是智慧城市各个领域都能够实现“智慧化”的关键性支撑技术,智慧城市的建设离不开大数据。建设智慧城市,是城市发展的新范式和新战略。大数据将遍布智慧城市的方方面面,从政府决策与服务,到人们衣食住行的生活方式,再到城市的产业布局和规划,直到城市的运营和管理方式,都将在大数据支撑下走向“智慧化”,大数据成为智慧城市的智慧引擎。

欧盟利用大数据实现智慧城市的做法给我们很多启示。

欧盟对智慧城市的评价分为六个方面:智慧经济、智慧治理、智慧生活、智慧人民、智慧环境、智慧移动性。也就是说智慧城市要促进经济的发展,要改进和帮助更多大众的参与,让老百姓享受智慧的生活,人民得到更好的服务,居住环境更加优化。智慧城市的应用很广泛,我们都知道有物流、交通、电网、工业、农业、建筑、环境、医疗等方面。现在我要讲的是,智慧城市本身会催生大数据,我们可以看到一个企业会涉及到很多环境,管理环境,开放环境,知识环境、服务环境,过去这些环境的关联度不够,那么现在通过数据库使得这些环境能够联合起来,使得企业的效率提高40%-60%,根据赛门铁克的一份最新调研报告,今天全世界所有企业的信息存储总量已达2.2ZB,企业平均10PB,大企业更大点,小企业小点。一般企业都会建立数据库,必须进行数据的集资和数据的挖掘,企业的数据在企业内部已经占有很重要的位置。

(1)智慧经济

首先大数据在商业上怎么能很好运用,它会分析用户的购物行为,什么商品搭配在一起会卖得更好,还有很多公司通过分析找到最佳客户,淘宝数据魔方则是淘宝平台上的大数据应用方案。那么商家可以了解淘宝平台上的行业宏观情况、自己品牌的市场状况、消费者行为情况等,并可以据此作出经营决策。

美国有个投资公司分析了全球3.4亿微博账户留言,判断民众情绪,人们高兴的时候会买股票,而焦虑的时候会抛售股票,依此决定公司股票的买入或卖出,该公司今年第一季度获得7%的收益率。

阿里公司根据在淘宝网上中小企业的交易状况筛选出财务健康和诚信的企业,从而无需担保来放贷,目前已放贷300多亿元,坏帐率仅0.3%,大大低于商业银行。

企业通过信息收集很好的掌握企业的运营状况,分析居民与财务有关的记录包括贷款申请、租赁、房地产、购买零售商品、纳税申报、水电费缴付、有线电视缴费、电话缴费、报纸与杂志订阅、机动车档案等,能够得出消费者的个人信用评分,从而推断客户支付意向与支付能力,发现潜在的欺诈。

IBM日本公司建立了一个经济指标预测系统,从互联网新闻中搜索影响制造业的480项经济数据,计算出采购经理人指数PMI预测值。

印第安纳大学学者利用Google提供的心情分析工具,对270万用户在2008年3~12月所张贴的970万条留言,挖掘出用户happiness、kindness、 alertness、sureness、 vitality 和calmness等六种心情,进而对道琼斯工业指数的变化进行预测,准确率达到87%。

利用大数据分析可实现对合理库存量的管理,华尔街对冲基金依据购物网站顾客评论分析企业产品销售状况,华尔街银行根据求职网站岗位数量推断就业率。

(2)智慧治理

美国纽约的警察分析交通拥堵与犯罪发生地点的关系,有效改进治安。美国纽约的交通部门从交通违规和事故的统计数据中发现规律,改进了道路设计。

利用短信、微博、微信和搜索引擎可以收集热点事件与舆情挖掘。

电信运营商拥有大量的手机数据,通过对手机数据的挖掘,不针对个人而是着眼于群体行为,可从中分析:实时动态的流动人口的来源及分布情况;出行和实时交通客流信息及拥塞情况。利用手机用户身份和位置的检测可了解突发性事件的聚集情况。

MIT的Reality Mining项目,通过对10万多人手机的通话、短信和空间位置等信息进行处理,提取人们行为的时空规则性和重复性,进行流行病预警和犯罪预测。

(3)环境监测

对城市的河流进行采样,通过卫星发布,收集产量的数据,这个数据非常大,通过这个数据分析能够判别城市中有没有污染。

(4)智慧医疗

无论是药品的研发还是商业模式的开发运用数据分析都能够得到很好的分析,我们医院里有大量的病例,这里有大量的数据,传统的普通病例很难挖掘数据,现在变成电子化有利于更高数据挖掘,数据的挖掘有利于发现医疗知识,由于医疗资源的分配不均,因此远程医疗十分必要,另外,居家监护很重要,谷歌公司与美国疾病控制和预防中心等机构合作,依据网民搜索内容分析全球范围内流感等病疫传播状况,谷歌的判断与疾控中心的判断是一致的。

社交网络为许多慢性病患者提供了临床症状交流和诊治经验分享平台,医院借此可获得足够多的临床效果统计。个性化的医疗同样很重要,我们发现,同样的治疗对一些病人无效,75%癌症病人,70%的老年痴呆者、50%的关节炎病人、43%的糖尿病患者、40%的哮喘病患者,38%的抑郁症病人。因为人体对药品代谢方式的差异取决于个体特定的基因、酶和蛋白质组合,因此基因信息对选择最优治疗非常关键。对人体个性体质的挖掘会做到真正意义上的对症下药,一个人的基因信息大概1GB。

(5)智能搜索

除此之外,我们还通过网络进行学习,早期的网络学习是通过网站专业人员编制的内容,如今我们希望能够实现更加智能的搜索。随着移动互联网的出现,搜索引擎会变成基于语音的智能搜索;基于位置的搜索;基于个性化搜索。

(6)舆情监测

大众传播发展的很快,这里包含着大量的数据,例如微博传播具有裂变性、主动性、即时性、便捷性、交互性、草根性,跟进性和临场感,每一个微博用户既是"服务器",也是"受众"。中国的微博比社交网络更热,因为140个字符的微博在英文和中为分别约等于25个和85个英语单词,即中文微博的信息量是Twitter的3~4倍。最近两个月在YouTube上上载的视频超过了ABC、 NBC和 CBS 电视台自1948年以来24/7/365 连续播出的内容,而"云平台+多屏融合"模式已成为智能家居和智能车载等的发展方向。

(7)精准营销

美国信用营销分析专家张川告诉《环球时报》记者,在大数据分析的应用上,美国政府和大公司领先新兴国家至少20年。15年前,美国的信用卡公司就可以进行数据挖掘实现精准营销:在合适的时间,通过合适渠道,把合适的营销信息投送给每个顾客。

(8)犯罪预警

随着智能电话和电脑网络的普及,美国政府和大公司把自己的触角伸到个人生活的每个方面。美国个人的一切在线行为数据都被收集储存,再加上已被有关机构掌握的个人信用数据、犯罪记录和人口统计等数据,有关公司和政府机构可以运用数据挖掘的办法,监控和预测个人的行为,并做出相关决策。

(9)全球安全监测

如美国已具备对全球网络空间的监视控制能力。斯诺登披露的“棱镜”计划,缘于美国政府的“星风”监视计划。2004年,布什政府通过司法程序,将“星风”监视计划分拆成由国家安全局执行的4个监视计划,除“棱镜”外,还包括“主干道”、“码头”和“核子”。其中,“棱镜”用于监视互联网个人信息。“核子”则主要负责截获电话通话者对话内容及关键词。“主干道”和“码头”分别对通信和互联网上数以亿兆计的“元数据”进行存储和分析。“元数据”主要指通话或通信的时间、地点、使用设备、参与者等,不包括电话或邮件等的内容。

(10)市场价格监测

肯尼思·丘基尔是《经济学家》杂志数据编辑、《大数据:一次将改变我们生活、工作和思考方式的革命》一书的合著者之一,他日前在美国《外交政策》杂志掀起一场有关“大数据时代令隐私保护问题更加突出”的讨论。丘基尔举例说,警方如果要侦破一个城市的加油站是否存在合谋操控价格的“卡特尔行为”,以往要靠线人举报。但今天,可以做大数据分析——分析该市油价变化和加油站分布情况。通过分析,可以发现正常的价格变化规律,如果价格变化持续异常,就可以怀疑存在价格垄断的行为。丘基尔认为,大数据的价值在于存储后的再使用。不过,关键的一个问题是,收集、保存一切信息,与隐私保护政策是有冲突的,“保存一切信息是必要的,但是在这么做之前,我们有必要问自己一个问题,即现行的隐私保护政策是不是妨碍了我们正在迈入的大数据世界”。丘基尔提到,社会有必要就此进行大辩论,以便为大数据时代的隐私保护划定新的边界。

结束语

美国IT咨询公司Avanade商业情报部副总裁斯蒂夫·帕尔默告诉《环球时报》记者,大数据是指非常“膨胀”的数据集,用典型的数据分析软件和工具难以对其进行捕捉、储存、管理、分享、分析和可视化。大数据有3个特征:一是数据的数量大;二是产生或被吸收的速度和频率快;三是数据的多样性。为从大数据中“挖出金矿”,一家企业或机构必须能够应对大数据上述3个特征。帕尔默说,大数据给人类带来的真正机遇是把许多信息碎片拼起来,为我们的决策服务。

附:全球顶尖大数据公司一览

企业名称:IBM

网址:http:///

2011年5月,IBM正式推出InfoSphere大数据分析平台。InfoSphere大数据分析平台包括 BigInsights和Streams,二者互补,Biglnsights基于Hadoop,对大规模的静态数据进行分析,它提供多节点的分布式计算,可以随时增加节点,提升数据处理能力。Streams采用内存计算方式分析实时数据。InfoSphere大数据分析平台还集成了数据仓库、数据库、数据集成、业务流程管理等组件。

企业名称:亚马逊

网址:http:///

对于云计算和大数据,亚马逊绝对具有先见之明,早在2009年就推出了亚马逊弹性MapReduce(Amazon Elastic MapReduce),亚马逊对Hadoop的需求和应用可谓了若指掌,无论是中小型企业还是大型组织。弹性MapReduce是一项能够迅速扩展的Web服务,运行在亚马逊弹性计算云(Amazon EC2)和亚马逊简单存储服务(Amazon S3)上。这可是货真价实的云:面对数据密集型任务,比如互联网索引、数据挖掘、日志文件分析、机器学习、金融分析、科学模拟和生物信息学研究,用户需要多大容量,立即就能配置到多大容量。

除了数据处理外,用户还可以使用Karmasphere Analyst的基于服务的版本,Karmasphere Analyst是一种可视化工作区,用于在亚马逊弹性MapReduce上分析数据。用户还可以提取结果文件,以便在数据库或者微软Excel或Tableau等工具中使用。

企业名称:甲骨文

网址:http:///

甲骨文在近期发布的Oracle大数据机(Oracle Big Data Appliance)为许多企业提供了一种处理海量非结构化数据的方法。在2011年10月初召开的Oracle OpenWorld 2011大会上甲骨文正式推出了Oracle大数据机。对于那些正在寻求以更高效的方法来采集、组织和分析海量非结构化数据的企业而言,该产品具有很大的吸引力。

与甲骨文近期推出的其他一体化产品一样,Oracle大数据机集成了硬件、存储和软件,包括Apache Hadoop软件的开源代码分发、新的甲骨文NoSQL数据库和用于统计分析的R语言开源代码分发。该产品被设计为能够与甲骨文Database 11g、Oracle Exadata数据库云服务器,以及针对商业智能应用的新的Oracle Exalytics商业智能云服务器一起协同工作。

企业名称:谷歌

网址:http:///

谷歌一直是科技行业的领军者,近年来几乎在任何一项互联网科技项目你都能看到谷歌的身影,大数据时代谷歌自然不会错过。何况如果对其拥有的海量数据进行深入挖掘,这对于提升谷歌搜索乃至所有谷歌服务的价值无可估量。

BigQuery是Google推出的一项Web服务,用来在云端处理大数据。该服务让开发者可以使用Google的架构来运行SQL语句对超级大的数据库进行操作。 BigQuery允许用户上传他们的超大量数据并通过其直接进行交互式分析,从而不必投资建立自己的数据中心。Google曾表示BigQuery引擎可 以快速扫描高达70TB未经压缩处理的数据,并且可马上得到分析结果。大数据在云端模型具备很多优势,BigQuery服务无需组织提供或建立数据仓库。而BigQuery在安全性和数据备份服务也相当完善。

去年底该服务只向一小部分开发者开放,现在任何人都可以注册这项服务。免费帐号可以让你每月访问高达100GB的数据,你也可以付费使用额外查询和存储空间。

企业名称:微软

网址:http:///

微软研究部门从2006年起就一直致力于某种非常类似于Hadoop的项目,被称为“Dryad”。今年年初,该计划通过与SQL Server和Windows Azure云的集成实现了Dryad的产品化。虽然现在微软还没有更新,但看上去Dryad似乎将成为在SQL Server平台上影响大数据爱好者的有力竞争者。

微软进入这一市场可谓“姗姗来迟”,而且在一定程度上说,数据仓库分析和内存分析计算市场落下了后腿。2011年初微软发布的SQL Server R2 Parallel Data Warehouse(PDW,并行数据仓库),PDW使用了大规模并行处理来支持高扩展性,它可以帮助客户扩展部署数百TB级别数据的分析解决方案。微软目前已经开始提供Hadoop Connector for SQL Server Parallel Data Warehouse和Hadoop Connector for SQL Server社区技术预览版本的连接器。 该连接器是双向的,你可以在Hadoop和微软数据库服务器之间向前或者向后迁移数据。

微软在去年推出了基于Azure云平台的测试版Hadoop服务,今年它承诺会推出与Windows兼容的基于Hadoop的大数据解决方案(Big Data Solution),这是微软SQL Server 2012版本(首发日期还不知道)的一部分,现在也不清楚微软是否会与其他硬件合作伙伴或者相关大数据设备厂商合作。

企业名称:EMC

网址:http:///

EMC于1979年成立于美国麻州Hopkinton市,1989年开始进入企业数据储存市场。 EMC公司是全球信息存储及管理产品、服务和解决方案方面的领先公司。EMC是每一种主要计算平台的信息存储标准,而且,世界上最重要信息中的 2/3 以上都是通过EMC的解决方案管理的。

面对大数据时代,EMC公司推出用于支持大数据分析的下一代平台――EMC Greenplum统一分析平台(UAP)。Greenplum UAP是一个唯一的统一数据分析平台,可扩展至其他工具,其独特之处在于,它将对大数据的认知和分享贯穿整个分析过程,实现比以往更高的商业价值。

企业名称:Teradata

网址:http:///

Teradata公司(Teradata Corporation,纽约证券交易所交易代码TDC)是全球领先的数据仓库,大数据分析和整合营销管理解决方案供应商,专注于数据库软件,数据仓库专用平台及企业分析方案。 不久前宣布推出一款集硬件、软件和服务于一体的全面产品组合——Teradata分析生态系统 (Teradata Analytical Ecosystem),使不同的 Teradata 系统实现无缝协作,为企业客户提供分析和更深入的洞察力,帮助其预测商业机会和加速实现商业价值。Teradata Unity 将确保整个Teradata Analytical Ecosystem的同步和统一。为了增强在大数据分析领域的优势, Teradata还收购Aster Data公司,以增强其非传统数据分析的能力,突破了SQL分析的限制,协助企业从全部数据中获取更多价值。

企业名称:NetApp

网址:http://

Network Appliance,Inc.(NetApp,美国网域存储技术有限公司)是IT存储业界的佼佼者,自1992年创业以来,不断以创新的理念和领先的技术引领存储行业的发展。Network Appliance, Inc. (NetApp) 是向目前的数据密集型企业提供统一存储解决方案的居世界最前列的公司。

NetApp StorageGRID 是一个久经验证的对象存储软件解决方案,设计用于管理 PB 级、全球分布的存储库,这些存储库包含企业和服务提供商的图像、视频和记录。通过消除数据块和文件中数据容器的典型约束,NetApp StorageGRID 提供了强大的可扩展性。它支持单个全局命名空间内的数十亿个文件或对象和 PB 级容量。

NetApp StorageGRID 实现了智能的数据管理和安全的内容保留。它通过一个具有内置安全性的全局策略引擎来优化数据存放、元数据管理和效率,该引擎管理数据的存储、放置、保护和检索的方式。此外,使用数字指纹和加密等技术防止内容受到篡改。

NetApp StorageGRID 有助于随时随地提供数据,以便于不间断地运营。该解决方案被设计为允许灵活进行部署配置,以满足全球的多站点组织的不同需要。

企业名称:Sybase

网址:

Sybase公司成立于1984年11月,总部设在美国加州的Emeryville(现为美国加州的Dublin市)。作为全球最大的独立软件厂商之一,Sybase公司致力于帮助企业等各种机构进行应用、内容及数据的管理和发布。

Sybase IQ是Sybase公司推出的特别为数据仓库设计的关系型数据库。 相比于传统的“行式存储”的关系型数据库, Sybase IQ 使用了独特的列式存储方式,在进行分析查询时,仅需读取查询所需的列,其垂直分区策略不仅能够支持大量的用户、大规模数据,还可以提交对商业信息的高速访问,其速度可达到传统的关系型数据库的百倍甚至千倍。“随着 Sybase IQ 不断地在分析应用 POC 测试中拔得头筹,有时甚至超过其他对手 100 倍之多”, Gartner 评价道,“ Sybase IQ 逐渐成为从数据集市到企业数据仓库架构最令人渴望的 DBMS (数据库管理系统)。”

自 2009 年推出以来, Sybase 陆续发布了 Sybase IQ 15.1 、 15.2 、 15.3 以至最新的 Sybase IQ 15.4 版本,每个版本都着力于增加新的核心能力以促进更深入的高级分析。Sybase IQ 15.4是面向大数据的高级分析平台,将大数据转变成可指挥每个人都行动的情报信息,从而在整个企业的用户和业务流程范围内轻松具备大数据的分析能力。

因此,有人说Sybase IQ15.4正在彻底改变“大数据分析”。

企业名称:惠普

网址:

大数据时代来临,老牌巨头惠普也不甘落后。不久前惠普企业服务事业部宣布推出全新服务,帮助客户更快部署惠普子公司Vertica的Vertica Analytics Platform ,从而迅速洞悉关键的业务信息,辅助决策过程。

Vertica Analytics Platform 让用户能够大规模实时分析物理、虚拟和云环境中的结构化、半结构化和非结构化数据,从而深入洞悉“大数据”。

Advanced Information Services for Vertica 帮助客户最大化实现 Vertica 分析平台性能,并构建企业分析专用环境。惠普提供从评估到实施的一系列服务,与客户共同定义多种交付方式组合,并找出匹配其现有基础设施的最佳解决方案。

Advanced Information Services for Vertica已在全球上市,将为实现“瞬捷”企业构建灵活的智能环境。

企业名称:沃尔玛

网址:http:///

在这里看到沃尔玛的身影,可能很多人会有疑问,全球最大的传统零售业巨头沃尔玛怎么就跟大数据扯上关系了?看了下面的介绍你就会明白了。

沃尔玛是最早通过利用大数据而受益的企业之一,曾经拥有世界上最大的数据仓库系统。通过对消费者的购物行为等非结构化数据进行分析,沃尔玛成为最了解顾客购物习惯的零售商,并创造了“啤酒与尿布”的经典商业案例。早在2007年,沃尔玛就已建立了一个超大的数据中心,其存储能力高达4Pb以上。《经济学人》在2010年的一篇报道中指出,沃尔玛的数据量已经是美国国会图书馆的167倍。

沃尔玛实验室计划将沃尔玛的10个不同的网站整合成一个,同时将一个10个节点的Hadoop集群扩展到250个节点的Hadoop集群。目前实验室正在设计几个能将当前像Oracle、Neteeza这样的开放资源的数据库进行迁移、整合的工具。

沃尔玛曾进行了一些列的收购,包括Kosmix(沃尔玛实验室前身)、Small Society、Set Direction、OneRiot、Social Calenda、Grabble等多家中小型创业公司,这些创业公司要么精于数据挖掘和各种算法,要么在移动社交领域有其专长,从此我们就可以看出沃尔玛进军移动互联网和挖掘大数据的决心。相信在沃尔玛的带领下,传统行业也会慢慢意识到大数据的重要性,加速步入大数据时代。

企业名称:Clustrix

网址:

Clustrix创立于2005年,是Y Combinator 2006年冬季班的成员。Clustrix可以为SQL数据库提供专利数据应用方法,帮助人们处理大量的数据,使SQL数据库无限扩容成为可能。最近Clustrix从Sequoia Capital、USVP和 ATA Ventures三家风险投资公司处再次获得价值675万美元的风险投资,至今已获融资1200万美元。Clustrix总部设在美国旧金山,研发中心设在西雅图。为打开欧洲市场,公司计划将总部迁至荷兰的阿姆斯特丹,并将于年底前在印度设立办公室。

企业名称:Cloudera

网址:http:///

Cloudera是一家专业从事基于Apache Hadoop的数据管理软件销售和服务的公司,总部位于加州帕洛阿尔托,2009年3月发布了第一款商业产品,当时获得由AccelPartners领投的500万美元投资。该公司于2010年6月正式推出Cloudera企业产品。 2011年11月募集到4000万美元风险投资资金,此轮融资由风险投资机构Ignition Partners的合伙人弗兰克·阿泰勒(Frank Artale)领投。Cloudera之前的投资者顶尖风投机构Accel Partners、Greylock Partners、Meritech Capital Partners 和In-Q-Tel也参与本轮投资。

以上企业以外,包括MapR、HStreaming、Hadapt、DataStax、Datameer这些与Hadoop以及大数据相关的新公司都已经获得投资,新一轮热潮正在兴起。

第五篇:大数据时代下数据挖掘技术与应用

【摘要】人类进入信息化时代以后,短短的数年时间,积累了大量的数据,步入了大数据时代,数据技术也就应运而生,成为了一种新的主流技术。而研究数据挖掘技术的理念、方法以及应用领域,将对我国各个领域的未来带来更多的机遇和挑战。本文就大数据时代下数据挖掘技术与应用进行探究。

【关键词】大数据,数据挖掘,互联网

数据挖掘是一门新兴的学科,它诞生于20世纪80年代,主要面向商业应用的人工只能研究领域。从技术角度来看,数据挖掘就是从大量的复杂的、不规则的、随机的、模糊的数据中获取隐含的、人们事先没有发觉的、有潜在价值和知识的过程。从商业角度来说,数据挖掘就是从庞大的数据库中抽取、转换、分析一些潜在规律和价值,从中获取辅助商业决策的关键信息和有用知识。

1.数据挖掘的基本分析方法

分析方法是数据挖掘的核心工作,通过科学可靠的算法才能实现数据的挖掘,找出数据中潜在的规律,通过不同的分析方法,将解决不同类型的问题。目前常用的方法有聚类分析、特征数据分析法、关联性分析等。

1.1聚类分析法。简单来说聚类分析就是通过将数据对象进行聚类分组,然后形成板块,将毫无逻辑的数据变成了有联系性的分组数据,然后从其中获取具有一定价值的数据内容进行进一步的利用。由于这种分析方法不能够较好的就数据类别、属性进行分类,所以聚类分析法一般都运用心理学、统计学、数据识别等方面。

1.2特征性数据分析法。网络数据随着信息时代的到来变成了数据爆炸式,其数据资源十分广泛并且得到了一定的普及,如何就网络爆炸式数据进行关于特性的分类就成为了当下数据整理分类的主要内容。此外还有很多方法都是通过计算机来进行虚拟数据的分类,寻找数据之间存在的普遍规律性完成数据的特性分析从而进行进一步分类。

1.3关联性分析法。有时数据本身存在一定的隐蔽性使得很难通过普通的数据分析法进行数据挖掘和利用,这就需要通过关联性分析法完成对于数据信息的关联性识别,来帮助人力完成对于数据分辨的任务,这种数据分析方法通常是带着某种目的性进行的,因此比较适用于对数据精准度相对较高的信息管理工作。

2.数据挖掘技术的应用

数据挖掘技术的具体流程就是先通过对于海量数据的保存,然后就已有数据中进行分析、整理、选择、转换等,数据的准备工作是数据挖掘技术的前提,也是决定数据挖掘技术效率及质量的主要因素。在完成数据准备工作后进一步对数据进行挖掘,然后对数据进行评估,最后实现运用。因此,数据挖掘能够运用到很多方面。如数据量巨大的互联网行业、天文学、气象学、生物技术,以及医疗保健、教育教学、银行、金融、零售等行业。通过数据挖掘技术将大数据融合在各种社会应用中,数据挖掘的结果参与到政府、企业、个人的决策中,发挥数据挖掘的社会价值,改变人们的生活方式,最大化数据挖掘的积极作用。以教育行业为例,探究数据挖掘技术在高校教育教学活动中的应用。

2.1在高校管理中的应用。数据挖掘技术在高校管理的内容主要包括:高校招生录取工作、贫困生选定以及优秀生评定等。高校每年的招生工作是学校可持续发展的重要环节,直接影响到高校教学质量以及发展情况。比如数据挖掘技术在高校管理中的应用主要是对学生高考成绩、志愿填报、以及生源来源地等多方面信息进行整理分类汇总。具体步骤是通过进行数据的收集和预处理,建立相关数据模型,采用分类算法,提取和挖掘对用户有用的信息,然后进行数据挖掘的数据存储形式。目前高校数据挖掘技术应用的范围比较广泛,由于高校管理内容比较复杂,因此在其管理内容的每个小部分也开始利用数据挖掘技术进行管理,比如学生成绩管理,课堂教学评价系统等。

2.2在高校课堂教学评价中的应用。数据挖掘技术在高校课堂教学评价系统中的应用主要也是利用关联分析法。首先先对数据进行预处理工作,数据的预处理是数据挖掘技术的关键步骤,并且直接影响着数据挖掘技术的应用效率。数据预处中要将教师的基本信息、教师教授课程以及教师的职称、学历、学生信息以及学生课表相关信息进行数据初始记录。对于教师的评价内容根据高校自身的条件和需求而定,学校教学评价管理部门登录学校教务系统后,将学生所选择的选项对应转换为教师的分值,通过计算机计算总分后得出教师的学期得分。学生对于教师教学的评价在一定程度上也反映了自己的学习情况,如对教师的评价为零分,则说明学生也否定了自己的学习效果。 2.3在高校学生信息管理系统中的应用。高校学生信息管理系统中管理要素主要是学校的领导、任课教师、学生以及家长。系统的功能要包括:对不同的用户设置不同的使用权限;对学生的基本信息以及学生浏览管理网站的记录要做到明确记录;各个学院不同专业的学生课程要能准确公布并允许学生根据实际情况修改;成绩管理要能实现大批量添加及修改;还有比如评优活动、党务管理等具体功能。数据挖掘技术在高校学生信息管理系统中的应用主要是利用决策树的方法。学生信息管理的基本数据就是学生入学时填写的基本信息表,内容包括学生的姓名、学号、考勤以及学习成绩等,这些都是学生特有的属性,学生信息管理利用决策树方法就是将学生的这些属性作为决策元素,监理不同的决策节点,实现对学生全方位的考核和评价,完整的了解到每位学生的具体信息。

2.4高校图书馆信息系统中的应用。数据挖掘技术最基本的应用就是通过对现有的数据进行分析来了解学校图书馆现有资源利用情况,为图书馆的未来建设提供可靠数据。数据挖掘技术能够使图书馆资源得到极大程度的优化整合。比如数据挖掘技术可以对检索记录进行整理,将手工数据转变为电子数据记录。其最大的优势就是利用数据挖掘技术更加全面的分析总结数据库资源,帮助图书馆管理人员对于图书馆信息的补充和调整,还能够为高校图书馆的馆藏工作建设提供有效的引导。数据挖掘还能应用于图书馆的多媒体数字资源,多媒体数据挖掘技术能够更为快捷和准确的为读者提供相应的服务。

3.结语

数据挖掘技术是近几年新产生的网络技术,可是它的广泛应用性受到了很多公司以及研究人员的喜爱。这些年来,伴随着时间的推移以及网络技术的不断发展大数据挖掘技术不断的被更新,开发,而且在金融、管理、教学等行业中都得到了广泛的应用。我相信随着网络技术的不断发展,大数据挖掘技术的应用面将会越来越广。

【参考文献】

[1] 董彩云 , 曲守宁 . 数据挖掘及其在高校教学系统中的应用 [J]. 济南大学学报 ( 自然科学版 ),2004(1): 65-68.

[2] 陆川,王静静.数据挖掘技术在高校教学管理中的应用研究[J].北京:电脑开发与应用,2009,3.

[3]《中国电子科学研究院学报》编辑部.大数据时代[J].中国电子科技研究院学报,2013(01):41-43. [4]魏娟,梁静国.基于数据挖掘技术的企业客户关系管理(CRM)[J].商业研究,2005(07).

上一篇:做个诚实的孩子故事下一篇:中国共产党历史沿革