网络技术与云计算

2022-07-18

第一篇:网络技术与云计算

大数据与云计算

摘 要:大数据(Big Data)这个概念近年来在越来越多的场合、被越来越多的人提及, 并且经常和云计算联系在一起,云计算与大数据之间到底是什么关系成为热点话题。本

专题报告包含以下四个方面内容:1. 大数据的价值;2. 大数据带来的挑战;3. 大数据研究成果;4. 云计算是大数据挖掘的主流方式。通过本报告阐述我们对大数据的理解,以及对大数据的价值的认识,探讨大数据处理与挖掘技术,大数据主要着眼于“数据”,提供数据采集、挖掘、分析的技术和方法; 云计算技术主要关注“计算”,提供IT 解决方案。大数据、云计算技术可以促进持续审计方式的发展、总体审计模式的应用、审计成果的综合应用、相关关系证据的应用、高效数据审计的发展和大数据审计师的发展。强化大数据、云计算技术审计应用的措施包括制定长远发展战略、加快审计法规建设、建立行业平台、加强研发和提高利用能力。 关键词:大数据 云计算 数据挖掘 对审计影响 政策建议 引言

目前,大数据伴随着云计算技术的发展,正在对全球经济社会生活产生巨大的影响。大数据、云计算技术给现代审计提供了新的技术和方法,要求审计组织和审计人员把握大数据、云计算技术的内容与特征,促进现代审计技术和方法的进一步发展。

一、大数据、云计算的涵义与特征

随着云计算技术的出现,大数据吸引了全世界越来越多的关注。哈佛大学社会学教授加里·金 ( 2012) 说: “这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。” ( 一) 大数据的涵义与特征

“数据”( data) 这个词在拉丁文里是“已知”的意思,也可以理解为“事实”。2009 年,“大数据”概念才逐渐开始在社会上传播。而“大数据”概念真正变得火爆,却是因为美国奥巴马政府在2012 年高调宣布了其“大数据研究和开发计划”。这标志着“大数据”时代真正开始进入社会经济生活中来了。“大数据”( big data) ,或称巨量资料,指的是所涉及的数据量规模大到无法利用现行主流软件工具,在一定的时间内实现收集、分析、处理或转化成为帮助决策者决策的可用信息。互联网数据中心( IDC)认为“大数据”是为了更经济、更有效地从高频率、大容量、不同结构和类型的数据中获取价值而设计的新一代架构和技术,用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。大数据具有4 个特点: 第一,数据体量巨大( Volume) ,从TB 级别跃升到PB 级别。第二,处理速度快( Velocity) ,这与传统的数据挖掘技术有着本质的不同。第三,数据种类多( Variety) ,有图片、地理位置信息、视频、网络日志等多种形式。第四,价值密度低,商业价值高( Value) 。存在单一数据的价值并不大,但将相关数据聚集在一起,就会有很高的商业价值( 金良,2012) 。大数据时代,不仅改变了传统的数据采集、处理和应用技术与方法,还促使人们思维方式的改变。大数据的精髓在于促使人们在采集、处理和使用数据时思维的转变,这些转变将改变人们理解和研究社会经济现象的技术和方法。

(1)是在大数据时代,不依赖抽样分析,而可以采集和处理事物整体的全部数据。19 世纪以来,当面临大的样本量时,人们都主要依靠抽样来分析总体。但是,抽样技术是在数据缺乏和取得数据受限制的条件下不得不采用的一种方法,这其实是一种人为的限制。过去,因为记录、储存和分析数据的工具不够科学,只能收集少量数据进行分析。如今,科学技术条件已经有了很大的提高,虽然人类可以处理的数据依然是有限的,但是可以处理的数据量已经大量增加,而且未来会越来越多。随着大数据分析取代抽样分析,社会科学不再单纯依赖于抽样调查和分析实证数据,现在可以收集过去无法收集到的数据,更重要的是,现在可以不再依赖抽样分析。

(2)是在大数据时代,不再热衷于追求数据的精确度,而是追求利用数据的效率。当测量事物的能力受限制时,关注的是获取最精确的结果。但是,在大数据时代,追求精确度已经既无必要又不可行,甚至变得不受欢迎。大数据纷繁多样,优劣掺杂,精准度已不再是分析事物总体的主要手段。拥有了大数据,不再需要对一个事物的现象深究,只要掌握事物的大致发展趋势即可,更重要的是追求数据的及时性和使用效率。与依赖于小数据和精确性的时代相比较,大数据更注重数据的完整性和混杂性,帮助人们进一步认识事物的全貌和真相。

(3)是在大数据时代,人们难以寻求事物直接的因果关系,而是深入认识和利用事物的相关关系。长期以来,寻找因果关系是人类发展过程中形成的传统习惯。寻求因果关系即使很困难且用途不大,但人们无法摆脱认识的传统思维。在大数据时代,人们不必将主要精力放在事物之间因果关系的分析上,而是将主要精力放在寻找事物之间的相关关系上。事物之间的相关关系可能不会准确地告知事物发生的内在原因,但是它会提醒人们事情之间的相互联系。人们可以通过找到一个事物的良好相关关系,帮助其捕捉到事物的现在和预测未来。 ( 二) 云计算的涵义与特征

“云计算”概念产生于谷歌和IBM 等大型互联网公司处理海量数据的实践。2006 年8 月9 日,Google首席执行官埃里克·施密特( Eric Schmidt) 在搜索引擎大会首次提出“云计算”的概念。2007 年10 月,Google 与IBM 开始在美国大学校园推广云计算技术的计划,这项计划希望能降低分布式计算技术在学术研究方面的成本,并为这些大学提供相关的软硬件设备及技术支持( Michael Mille,2009) 。目前全世界关于“云计算”的定义有很多。“云计算”是基于互联网的相关服务的增加、使用和交付模式,是通过互联网来提供动态易扩展且经常是虚拟化的资源。美国国家标准技术研究院( NIST) 2009年关于云计算的定义是: “云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池( 资源包括网络、服务器、存储、应用软件、服务等) ,这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。”根据这一定义,云计算的特征主要表现为: 首先,云计算是一种计算模式,具有时间和网络存储的功能。其次,云计算是一条接入路径,通过广泛接入网络以获取计算能力,通过标准机制进行访问。第三,云计算是一个资源池,云计算服务提供商的计算资源,通过多租户模式为不同用户提供服务,并根据用户的需求动态提供不同的物理的或虚拟的资源。第四,云计算是一系列伸缩技术,在信息化和互联网环境下的计算规模可以快速扩大或缩小,计算能力可以快速、弹性获得。第五,云计算是一项可计量的服务,云计算资源的使用情况可以通过云计算系统检测、控制、计量,以自动控制和优化资源使用。 ( 三) 大数据与云计算的关系

从整体上看,大数据与云计算是相辅相成的。大数据主要专注实际业务,着眼于“数据”,提供数据采集、挖掘、分析的技术和方法,强调的是数据存储能力。云计算主要关注“计算”,关注IT 架构,提供IT 解决方案,强调的是计算能力,即数据处理能力。如果没有大数据的数据存储,那么云计算的计算能力再强大,也难以找到用武之地; 如果没有云计算的数据处理能力,则大数据的数据存储再丰富,也终究难以用于实践中去。

从技术上看,大数据依赖于云计算。海量数据存储技术、海量数据管理技术、MapReduce 编程模型都是云计算的关键技术,也都是大数据的技术基础。而数据之所以会变“大”,最重要的便是云计算提供的技术平台。数据被放到“云”上之后,打破了过去那种各自分割的数据存储,更容易被收集和获得,大数据才能呈现在人们眼前。而巨量的数据也只能依靠云计算强大的数据处理能力,才能够“淘尽黄沙始得金”。

从侧重点看,大数据与云计算的侧重点不同。大数据的侧重点是各种数据,广泛、深入挖掘巨量数据,发现数据中的价值,迫使企业从“业务驱动”转变为“数据驱动”。而云计算主要通过互联网广泛获取、扩展和管理计算及存储资源和能力,其侧重点是IT 资源、处理能力和各种应用,以帮助企业节省IT部署成本。云计算使企业的IT 部门受益,而大数据使企业的业务管理部门受益。

从结果看,大数据与云计算带来不同的变化。大数据对社会经济带来的变化是巨大的,涉及到各个领域。大数据已经与资本、人力一起作为生产的主要因素影响着社会经济的发展。数据创造价值,而挖掘数据价值、利用数据的“推动力”就是云计算。云计算将信息存储、分享和挖掘能力极大提高,更经济、高效地将巨量、高速、多变的终端数据存储下来,并随时进行计算与分析。通过云计算对大数据进行分析、总结与预测,会使得决策更可靠,释放出更多大数据的内在价值。

二、大数据、云计算技术对审计的影响分析

审计技术和方法的发展是随着科学和管理技术的发展而发展的。现代审计技术和方法体系是在原始的查账基础上从低级向高级、从不完备到比较完备发展起来的。在业务和会计处理手工操作阶段,审计实施的是账表导向的审计技术和方法; 当内部控制理论和方法全面应用于业务和会计处理时,审计实施的是系统导向的审计技术和方法; 当风险管理理论和方法全面应用于业务和财务管理时,审计实施的是风险导向审计技术和方法; 与风险导向审计技术和方法并行的是,计算机技术广泛应用于业务和会计处理时,审计实施的是IT 审计技术和方法。目前,面对大数据、云计算技术的产生和发展,审计人员需要应时而变来适应由此而带来的变化,分析大数据、云计算技术对审计方式、审计抽样技术、审计报告模式、审计证据搜集等技术和方法的影响。 ( 一) 大数据、云计算技术促进持续审计方式的发展

传统审计中,审计人员只是在被审计单位业务完成后才进行审计,而且审计过程中并不是审计所有的数据和信息,只是抽取其中有的一部分进行审计。这种事后和有限的审计对被审计单位复杂的生产经营和管理系统来说很难及时做出正确的评价,而且对于评价日益频繁和复杂的经营管理活动的真实性和合法性则显得过于迟缓。随着信息技术迅速发展,越来越多的审计组织对被审计单位开始实施持续审计方式,以解决审计结果与经济活动的时差问题。但是,审计人员实施持续审计时,往往受目前业务条件和信息化手段的限制,取得的非结构化数据无法数据化,或者无法取得相关的明细数据,致使对问题的判断也难以进一步具体和深入。而大数据、云计算技术可以促进持续审计方式的发展,使信息技术与大数据、云计算技术较好交叉融合,尤其对业务数据和风险控制“实时性”要求较高的特定行业,如银行、证券、保险等行业,在这些行业中实施持续审计迫在眉睫。如审计组织对商业银行的审计,实行与商业银行建立业务和数据系统的接口,在开发的持续审计系统中固化了非结构化数据结构化和数据分析模块,该模块可以在海量贷款客户中挖掘、分析出行业性和区域性贷款风险趋势,实现在线的风险预警,并将发现的风险数据、超预警值指标及问题登记为疑点,并建立实时审计工作底稿,按照重要程度进行归类、核实或下发给现场审计人员进行现场核实,以较好处理非结构化数据的利用和数据的实时分析利用问题。 ( 二) 大数据、云计算技术促进总体审计模式的应用

现时的审计模式是在评价被审计单位风险基础上实施抽样审计。在不可能收集和分析被审计单位全部经济业务数据的情况下,现时的审计模式主要依赖于审计抽样,从局部入手推断整体,即从抽取的样本着手进行审计,再据此推断审计对象的整体情况。这种抽样审计模式,由于抽取样本的有限性,而忽视了大量和具体的业务活动,使审计人员无法完全发现和揭示被审计单位的重大舞弊行为,隐藏着重大的审计风险。而大数据、云计算技术对审计人员而言,不仅仅是一种可供采用的技术手段,这些技术和方法将给审计人员提供实施总体审计模式的可行性。利用大数据、云计算技术,对数据的跨行业、跨企业搜集和分析,可以不用随机抽样方法,而采用搜集和分析被审计单位所有数据的总体审计模式。利用大数据、云计算技术的总体审计模式是要分析与审计对象相关的所有数据,使得审计人员可以建立总体审计的思维模式,可以使现代审计获得革命性的变化。审计人员实施总体审计模式,可以规避审计抽样风险。如果能够收集总体的所有数据,就能看到更细微、深入的信息,对数据进行多角度的深层次分析,从而发现隐藏在细节数据中的对审计问题更具价值的信息。同时,审计人员实施总体审计模式,能发现从审计抽样模式所不能发现的问题。大数据、云计算技术给审计人员提供了一种能够从总体把握审计对象的技术手段,从而帮助审计人员能从总体的视角发现以前难以发现的问题。

( 三) 大数据、云计算技术促进审计成果的综合应用

目前,审计人员的审计成果主要是提供给被审计单位的审计报告,其格式固定,内容单一,包含的信息量较少。随着大数据、云计算技术在审计中广泛应用,审计人员的审计成果除了审计报告外,还有在审计过程中采集、挖掘、分析和处理的大量的资料和数据,可以提供给被审计单位用于改进经营管理,促进审计成果的综合应用,提高审计成果的综合应用效果。首先,审计人员通过对审计中获取的大量数据和相关情况资料的汇总、归纳,从中找出财务、业务和经营管理等方面的内在规律、共性问题和发展趋势,通过汇总归纳宏观性和综合性较强的审计信息,为被审计单位投资者和其他利益相关者提供数据证明、关联分析和决策建议,从而促进被审计单位管理水平的提高。其次,审计人员通过应用大数据、云计算技术,可以将同一问题归入不同的类别进行分析和处理,从不同的角度、不同的层面整合提炼以满足不同层次的需求。再次,审计人员将审计成果进行智能化留存,通过大数据、云计算技术,将问题规则化并固化到系统中,以便于计算或判断问题发展趋势,向被审计单位进行预警。最后。审计人员将审计成果、被审计单位与审计问题进行关联,并进行信息化处理,在进行下次审计时,减少实地审计的时间和工作量,提高审计工作的效率。 ( 四) 大数据、云计算技术促进相关关系证据的应用

审计人员在审计过程中,应根据充分、适当的审计证据发表审计意见,出具审计报告。但是,在大数据、云计算环境下,审计人员既面临巨量数据筛选的考验,又面临搜集适当审计证据的挑战。审计人员在搜集审计证据时,传统的思维路径都是基于因果关系来搜集审计证据,而大数据分析将会更多地运用相关关系分析来搜集和发现审计证据。但从审计证据发现的角度来看,由于大数据技术提供了前所未有的跨领域、可供量化的维度,使得审计问题大量的相关信息能够得以记录和计算分析。大数据、云计算技术没有改变事物间的因果关系,但在大数据、云计算技术中对相关关系的开发和利用,使得数据分析对因果逻辑关系的依赖降低了,甚至更多地倾向于应用基于相关关系的数据分析,以相关关系分析为基础的验证是大数据、云计算技术的一项重要特征。在大数据、云计算技术环境下,审计人员能搜集到的审计证据大多是电子证据( 秦荣生,2013) 。电子证据本身就非常复杂,云计算技术使获取有因果关系的证据更加困难。审计人员应从长期依赖因果关系来搜集和发现审计证据,转变成为利用相关关系来搜集和发现审计证据。 ( 五) 大数据、云计算技术促进高效数据审计的发展

直到今天,审计人员的数字审计技术依然建立在精准的基础上。这种思维方式适用于掌握“小数据量”的情况,因为需要分析的数据很少,所以审计人员必须尽可能精准地量化被审计单位的业务。随着大数据、云计算技术成为日常生活中的一部分,审计人员应开始从一个比以前更大、更全面的角度来理解被审计单位,将“样本= 总体”植入审计人员的思维中。相比依赖于小数据和精确性的时代,大数据更强调数据的完整性和混杂性,帮助审计人员进一步接近事情的真相,“局部”和“精确”将不再是审计人员追求的目标,审计人员追求的是事物的“全貌”和“高效”。围绕大数据,一批新兴的数据挖掘、数据存储、数据处理与分析技术将不断涌现。在实施审计时,审计人员应利用大数据、云计算技术,使用分布式拓朴结构、云数据库、联网审计、数据挖掘等新型的技术手段和工具,以提高审计的效率。

( 六) 大数据、云计算技术促进大数据审计师的发展

大数据、云计算时代,数据的真实、可靠是大数据发挥作用的前提。这客观上要求专业人员来对大数据的真实性、可靠性进行鉴证,审计人员可以扮演这种角色,或者称为数据审计师。能对大数据真实性、可靠性进行鉴证的数据审计师应该是计算机科学、数学、统计学和审计学领域的专家,他们应有大数据分析和预测的评估能力。数据审计师应恪守公正的立场和严守保密的原则,面对海量的数据和纷繁复杂的相关关系,选取分析和预测工具,以及解读数据及数据计算结果是否真实、可靠。一旦出现争议,数据审计师有权审查与分析结果相关的运算法则、统计方法以及数据采集、挖掘和处理过程。数据审计师的出现是为满足以市场为导向来解决数据真实性、可靠性问题的需求,这与20 世纪初期为了处理财务信息虚假而出现的审计人员一样,都是为了满足新需求而出现的。

三、大数据挖掘

数据的价值只有通过数据挖掘才能从低价值密度的数据中发现其潜在价值,而大数据挖掘技术的实现离不开云计算技术。在业界,全球著名的Google、EMC、惠普、IBM、微软等互联网公司都已经意识到大数据挖掘的重要意义。上述IT 巨头们纷纷通过收购大数据分析公司,进行技术整合,希望从大数据中挖掘更多的商业价值。数据挖掘通常需要遍历训练数据获得相关的统计信息,用于求解或优化模型参数,在大规模数据上进行频繁的数据访问需要耗费大量运算时间。数据挖掘领域长期受益于并行算法和架构的使用,使得性能逐渐提升。过去15 年来,效果尤其显著。试图将这些进步结合起来,并且提炼。GPU 平台从并行上得到的性能提升十分显著。这些GPU 平台由于采用并行架构,使用并行编程方法,使得计算能力呈几何级数增长。即便是图形处理、游戏编程是公认的复杂,它们也从并行化受益颇多。研究显示数据挖掘、图遍历、有限状态机是并行化未来的热门方向。MapReduce 框架已经被证明是提升GPU 运行数据挖掘算法性能的重要工具。D.Luo 等提出一种非平凡的策略用来并行一系列数据挖掘与数据挖掘问题,包括一类分类SVM 和两类分类SVM,非负最小二乘问题,及L1 正则化回归(lasso)问题。由此得到的乘法算法,可以被直截了当地在如MapReduce 和CUDA 的并行计算环境中实现。K. Shim 在MapReduce 框架下,讨论如何设计高MapReduce 算法,对当前一些基于MapReduce 的数据挖掘和数据挖掘算法进行归纳总结,以便进行大数据的分析。Junbo Zhang 等提出一种新的大数据挖掘技术,即利用MapRedue 实现并行的基于粗糙集的知识获取算法,还提出了下一步的研究方向,即集中于用基于并行技术的粗糙集算法处理非结构化数据。F.Gao 提出了一种新的近似算法使基于核的数据挖掘算法可以有效的处理大规模数据集。当前的基于核的数据挖掘算法由于需要计算核矩阵面临着可伸缩性问题,计算核矩阵需要O(N2 ) 的时间和空间复杂度来计算和存储。该算法计算核矩阵时大幅度降低计算和内存开销,而且并没有明显影响结果的精确度。此外,通过折中结果的一些精度可以控制近似水平。它独立于随后使用的数据挖掘算法并且可以被它们使用。为了阐明近似算法的效果,在其上开发了一个变种的谱聚类算法,此外设计了一个所提出算法的基于MapReduce 的实现。在合成和真实数据集上的实验结果显示,所提出的算法可以获得显著的时间和空间节省。Christian Kaiser 等还利用MapReduce 框架分布式实现了训练一系列核函数学习机,该方法适用于基于核的分类和回归。Christian Kaiser 还介绍了一种扩展版的区域到点建模方法,来适应来自空间区域的大量数据。Yael Ben-Haim 研究了三种MapReduce 实现架构下并行决策树分类算法的设计, 并在Phoenix 共享内存架构上对SPRINT 算法进行了具体的并行实现。F. Yan 考虑了潜在狄利克雷分配(LDA) 的两种推理方法——塌缩吉布斯采样(collapsed Gibbssampling,CGS)和塌缩变分贝叶斯推理(collapsedvariational Bayesian,CVB)在GPU 上的并行化问题。为解决GPU 上的有限内存限制问题,F. Yan 提出一种能有效降低内存开销的新颖数据划分方案。这种划分方案也能平衡多重处理器的计算开销,并能容易地避免内存访问冲突。他们使用数据流来处理超大的数据集。大量实验表明F. Yan 的并行推理方法得到的LDA 模型一贯地具有与串行推理方法相同的预测能力;但在一个有30 个多核处理器的GPU 上,CGS 方法得到了26倍的加速,CVB 方法得到了196 倍的加速。他们提出的划分方案和数据流方式使他们的方法在有更多多重处理器时可伸缩,而且可被作为通用技术来并行其它数据挖掘模型。Bao-Liang Lu 提出了一种并行的支持向量机,称为最小最大模块化网络(M3),它是基“分而治之”的思想解决大规模问题的有效的学习算法。针对异构云中进行大数据分析服务的并行化问题G.Jung 提出了最大覆盖装箱算法来决定系统中多少节点、哪些节点应该应用于大数据分析的并行执行。这种方法可以使大数据进行分配使得各个计算节点可以同步的结束计算,并且使数据块的传输可以和上一个块的计算进行重叠来节省时间。实验表明,这种方法比其他的方法可以提高大约60% 的性能。在分布式系统方面,Cheng 等人 提出一个面向大规模可伸缩数据分析的可伸缩的分布式系统——GLADE。GLADE 通过用户自定义聚合(UDA)接口并且在输入数据上有效地运行来进行数据分析。文章从两个方面来论证了系统的有效性。第一,文章展示了如何使用一系列分析功能来完成数据处理。第二,文章将GLADE 与两种不同类型的系统进行比较:一个用UDA 进行改良的关系型数据库(PostgreSQL)和MapReduce(Hadoop)。然后从运行结果、伸缩性以及运行时间上对不同类型的系统进行了比较。

四、总结 大数据的超大容量自然需要容量大,速度快,安全的存储,满足这种要求的存储离不开云计算。高速产生的大数据只有通过云计算的方式才能在可等待的时间内对其进行处理。同时,云计算是提高对大数据的分析与理解能力的一个可行方案。大数据的价值也只有通

过数据挖掘才能从低价值密度的数据中发现其潜在价值,而大数据挖掘技术的实现离不开云计算技术。总之,云计算是大数据处理的核心支撑技术,是大数据挖掘的主流方式。没有互联网,就没有虚拟化技术为核心的云计算技术,没有云计算就没有大数据处理的支撑技术。

参考文献

秦荣生. 大数据、云计算技术对审计的影响研究 何清. 大数据与云计算

张为民. 云计算: 深刻改变未来

文峰. 云计算与云审计———关于未来审计的概念与框架的一些思考

Big data and cloud computing Big Data (Big Data) in recent years, more and more occasions, the concept is mentioned more and more people, And often, and cloud computing together, what is the relationship between cloud computing and big data become a hot topic. this Special report contains the following four aspects: 1. The value of big data; 2. Big data challenge; 3. Big data research; 4. Cloud computing is the mainstream way of data mining. Through this report on our understanding of big data, as well as the understanding of the value of big data, large data processing and mining technology, large data mainly focus on "data", provide the technology and methods of data collection, mining and analysis; Cloud computing technology focusing on "computing", providing IT solutions. Big data and cloud computing technology can promote the development of continuous audit mode, the overall audit mode of application, the audit results of comprehensive application, the application of related evidence, the development of efficient data audit and the development of large data auditor. Strengthen big data and cloud computing technology measures of audit applications include set up long-term development strategy, accelerate the construction of the audit regulations, establish a platform, to strengthen research and development and improve the utilization ability. Keywords: big data cloud computing data mining impact on the audit policy Suggestions

第二篇:大数据与云计算的安全

云计算和大数据结合的安全问题

摘要:云计算的浪潮还没有过去,大数据时代已经到来。在对大数据的含义、特征、影响和意义进行系统总结的基础上,分析了大数据与云计算的关系,论述大数据和云计算的安全将给消费者和电商带来更加高效的转型。

关键字:云计算,大数据,电商

所谓通信,最简单的理解,也是最基本的理解,就是人与人沟通的方法。无论是现在的电话,还是网络,解决的最基本的问题,实际还是人与人的沟通。现代通信技术,就是随着科技的不断发展,如何采用最新的技术来不断优化通信的各种方式,让人与人的沟通变得更为便捷,有效。随着计算机技术的广泛普及与计算机远程信息处理应用的发展,云计算和大数据应运而生。、

一、大数据的介绍

大数据(Big Data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯(在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法)。大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域,目前人们谈论最多的是大数据技术和大数据应用。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和或虚拟化技术。

二、云计算的介绍

云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机和其他设备。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。几年之内,云计算已从新兴技术发展成为当今的热点技术。云计算从节约成本的工具到盈利的推动器,从ISP(网络服务提供商)到电信企业,已然成功地从内置的IT 系统演变成公共的服务。然而人们担心他们在云端的数据安全。正因为此,用户应该期待看到更安全的应用程序和技术上来。许多新的加密技术,安全协议,在未来会越来越多的呈现出来。其中的安全性和遵从性的问题仍然是阻碍云计算发展的重要原因。

三、二者联系和安全策略

近几年由于科技的不断发展,3G网络视频通话,移动互联网、物联网、智能手机,这些科技产品都一一涌现,充斥着我们的生活,确实互联网给我们的生活带来了方便,但同时恶意软件,黑客入侵电脑,这些人为的破坏,也影响着个人或者企业的信息安全。在这个时候新技术云计算的出现,就给传统互联网信息安全带来了希望,但同时也面临解决新的安全挑战。

多种方式应对云计算安全挑战—云计算给信息安全带来的挑战包括:第一,传统安全产品无法应对云计算环境下的网络结构和协议。在云计算环境中,可能前端的Web服务器和后端的数据库都处在一个物理服务器上,这样它们之间的网络交互直接用虚拟交换机就可以了,数据根本不经过物理交换机,如果不到物理交换机,则信息安全设备拿不到它的数据,导致对其访问控制、审计、攻击的检测,都没办法实现。第二,云计算技术特性带来一些新的安全需求。云安全架构的一个关键特点是云服务提供商所在的等级越低,云服务用户自己所要承担的安全能力和管理职责就越多。数据安全包括:数据传输、数据隔离、数据残留。应用安全包括:终端用户安全、SaaS安全、PaaS安全、IaaS安全。虚拟化安全包括:虚拟化软件、虚拟服务器等。第三,云计算环境对安全产品的计算性能提出了非常大的挑战。目前保护信息安全产品的性能已经远远落后于网络设备。大数据将会化解APT(高级持续威胁)危机—近一两年,APT攻击是非常热门的话题。简单的说就是黑客组织针对一个有价值的目标,进行长期、缓慢的,但是非常有技术含量的攻击。我们知道未来大数据和云计算将推动下一代安全数据的创新。大数据和云计算扩展了整个IT领域的计算和存储资源,给信息安全提供了信息平台和大数据处理的技术支撑,为整个信息安全产品的革新创造了一个更大的可能性。 其中数据加密就是对数据信息的重新组合,只有在收发双方的基础上才能够还原网络信息,数据加密技术能够确保校园网内部信息数据的安全性与完整性,并具有一定的保密作用,从某种意义上来说它是其他安全技术的基本保证,经过加密的网络数据能够确保数据在收录、传输、使用及转换中不被第三方得知数据信息内容。

综上所述:大数据是本,云计算是术,移动互联网是用。三者紧密结合在一起才能让整个信息安全系统更有效的服务现代人们的生活。在大数据环境下,即高流量、巨大海量数据、高可靠性。更多需要通过检测、分析、发现及预警的安全保障体系,实现可靠性、可用性与安全性的完美结合;利用大数据分析,可提前、精确、有效地发现已知或未知的安全威胁;可实现数据访问的记录、分析及取证;可实现有效、精确地发现隐私数据的检测分析与防护。安全检测与大数据技术结合,利用云计算能力及大数据处理机制实现信息访问和审计,安全威胁智能的发现,隐私数据的保护。

参考文献:《大数据时代》--[英]维克托·迈尔-舍恩伯格(ViktorMayer-Schönberger)--浙江人民出版社

电子图书:《云计算安全指南》--Ronald L.Krutz , Russell Dean Vines(著) 张立强 (译)

姓名:孙飞龙

学号:12901337

学院:信息工程学院

第三篇:未来五年,大数据将与云计算更加融合

国内最具权威的市场调研门户网站之一

未来五年,大数据将与云计算更加融合

云端的大数据就像科幻小说里对未来的描绘一样:它在这,只是不是很均匀地分布罢了。

高调的厂商,比如AWS、谷歌、微软、IBM和Rackspace等,都提供云基础的Hadoop和NoSQL数据库平台来支持大数据应用程序。很多初创公司都引入了云平台上的管理服务,按需部署自己的系统。大数据和云计算的融合往往是互联网公司的首先项,尤其是初创的软件和数据服务供应商。

但很多主流公司并不像互联网公司那样看重云端数据管理。一些公司担心云端的数据安全和隐私保护。一些公司还在大型机和其他本地系统里运行大部分操作。存储在本地的数据量之大,让数据迁移充满挑战。另外,现存数据中心可用的处理能力让AWS和谷歌等公有云的成本优势不值一提,即使公司对于云系统所谓的降低成本、增加弹性有兴趣,最终也未必会选择它。

花旗集团就是一个例子。随着网络成为普及的应用界面,金融服务公司面对的是洪水般的非结构化数据。它还需要处理线上金融应用程序中不同的数据结构。这些挑战让花旗集团最后选择了MongoDB NoSQL数据库。MongoDB获得了AWS和其他云平台的支持。花旗数据公司负责平台工程的全球领导者Michael Simone表示,花旗选择了在云端应

学数据分析、找行业报告、招调查人才可移步一起调研网

一个属于调研行业的B2B网站

国内最具权威的市场调研门户网站之一

用该软件。不过它应用的是私有云,应用限定在纽约公司的防火墙内,由它的IT部门全权管理。

在纽约的MongoDB大会上,Simone告诉与会者:“目前,我们还没有扩展私有云或集成公有云的打算。花旗集团的数据中心很大,技术积累也很深厚,我们可以构建自己的内部部署的云计算。” 大数据云才刚刚开始

总体来看,在云端运行大数据系统仍然是小众行为。在数据仓库研究院开发的大数据成熟度模型中,十个月内有222名IT和业务专家完成了线上测评,只有19%的人表示它们的组织在用公有云、私有云和混合云支持大数据应用程序。另有40%的人表示正在考虑云部署,同时有超过三分之一的人表示它们没有使用云计算的计划。在企业管理协会和9sight咨询公司开展的线上调查中,云计算使用比例略高:259名受访者中,39%的人表示他们的大数据安装包括云系统。

WeatherChannel公司是采用了公有云的案例,Basho技术公司在AWS可用性区域的多个分区运行了Basho技术公司的NoSQL数据库Riak的复制实例,处理和存储来自卫星、雷达系统、天气站等来源的混合数据。该数据库每五分钟就为预测引擎更新3万6千多地理天气网格的视图,它还用于归档历史数据。

美国TWC公司执行副总裁兼CIO Bryson Koehler认为,Riak的容错技术和同时支持内存和硬盘存储的功能特别好。经过比较,因为处理效果低,主流关系型数据库并不能适应高容量的云环境,至少不能以较低的成本适应高容量的云环境。

但是,在云端部署NoSQL软件也是旨在扩大TWC灵活性的更广泛的IT战略的题中之义。公司在谷歌云和AWS上运行应用程序,以免被任何供应商或技术锁定。

学数据分析、找行业报告、招调查人才可移步一起调研网

一个属于调研行业的B2B网站

国内最具权威的市场调研门户网站之一

云计算:更多选择 更多可能

公有云供应商已经为了满足大数据需求,已经扩展了数据管理能力,不止包含关系型数据库。例如,亚马逊近几年拓宽了AWS云选项,包含了很多新兴技术,比如NoSQL数据库DynamoDB、Hadoop部署ElasticMapReduce和ElastiCache内存缓存服务、Redshift数据仓库和Kinesis流数据系统。

美国咨询公司Cloud Technology Partners高级副总裁DavidLinthicum表示:“AWS和其他云供应商也创建了相当成熟的服务。一些可用的数据管理云平台已经发展到第五代第六代了。”

对于拥有强大的内部处理能力的大公司来说,给大数据管理池增加云基础的系统并不是必须的。美国云服务咨询公司Nimbo的首席基础架构师Aaron Ebertowski表示:“为什么要企业定购它们已经有了的东西呢?企业已经在存储架构投了成百上千美元,不会轻易舍弃的。”

业绩要求也是公有云不受大数据用户青睐的原因之一。加拿大海洋网络(ONC)是一家非营利性机构,该机构管理着英属哥伦比亚的一对海洋气象台,计划建立一个公司内部私有云,为使用海洋传感器提供数据的应用模拟地震和海啸创造条件。

目标在于更加准确地预测可能发生的自然灾害带来的后果,为政府当局采取预防措施缓解自然灾害给人们带来的影响,Benoit Pirenne这样说道,他是ONC的数字基础设施主管。

需求——充足的大数据力量

学数据分析、找行业报告、招调查人才可移步一起调研网

一个属于调研行业的B2B网站

国内最具权威的市场调研门户网站之一

该机构位于维多利亚大学,去年春天得到了一项三年项目的批准和资金支持。计划进行的分析工作包括收集传感器的多次测定结果,运行预测模型以得出可能发生的所有情况集。但是完成这项工作需要大量数据和强大的计算能力,Pirenne说道。 “要计算现实状况中的“模拟”几乎是不可能完成的任务,就算在非常高级的平行云系统中也不行。”他说。因此,ONC正在与IBM合作构建一个内部云加过来处理流程和分析工作。

新兴的管理服务供应商——例如Altiscale, BitYota, Qubole, Treasure Data和Rackspace’sObjectRocket附属公司等——称他们通过以低于云平台供应商的价格接管部署和管理任务,能够为用户企业将大数据云装置做的更方便、更划算。 美国的Sellpoints公司是一个线上营销和分析服务供应商,使用Hadoop和Spark的流程工具迅速构建查询表格,查询数据量达到TB用户网页活跃度数据,BennyBlum如此说,他是Sellpoint公司业绩营销和分析的副总裁。 Hadoop实用工具

Blum的公司首先将其自身的Hadoop系统应用到了亚马逊弹性计算云(或EC2)平台上。但是现在该公司已经换成了Altiscal的Hadoop作为服务供应。这一服务也在亚马逊云上运行,但是Blum表示将Hadoop的构造和管理下线为Sellpoints带来了红利。“Altiscale为我们管理了基础设施,这样我们就不必为维护集群而付运营费了。” 但是至少迄今为止,该类服务的用户基本都是这些新兴企业自身。大多是服务供应商的顾客基础还维持在一位数或两位数。

学数据分析、找行业报告、招调查人才可移步一起调研网

一个属于调研行业的B2B网站

国内最具权威的市场调研门户网站之一

RickSherman是AthenaIT解决方案这一美国咨询公司的创始人,他认为有理由相信基于云端的Hadoop服务尤其能够在更广阔的基础上运行。“人们在使用自给自足的Hadoop时遇到了一堵墙,”他说。“这在时间和技巧上都需要付出很多。我认为最终Hadoop作为服务会比公司内部Hadoop更具吸引力。”

然而有些企业还完全没有准备好接受公有云中的Hadoop,而且近期内也不会准备好接受。这就是Ayad Shammout所面临的问题,他是美国Beth Israel Deaconess医学中心(BIDMC)的数据平台和商务智能主管。去年他还是位独立咨询师的时候,就与另一位咨询师合作,为BIDMC做了一个大数据和云计算定义证明项目。为了降低SQL服务器数据库上的存储量和流程需求,他们使用了Azure HDInsight,Microsoft的基于云端的Hadoop发行,用以卸载应用审计日志的存档文件,这些日志用于微软的Azure云管理报告。

Shammout表示示范项目展示出了在云端云顶Hadoop应用的潜力。他还认为像BIDMC这种卫生保健型供应商最终能够将其实现。但是在未来几年之内,美国的联邦健康保险可移植性法案和问责制法案还阻碍着生产的展开。

“如果三四年前我跟你谈论云端,我会说‘这不会发生的。’”Shammout说道。“现在我认为云端会在某些部门实现应用。我的期望是再过三四年,云数据隐私就不成问题了。

摘自:36大数据

学数据分析、找行业报告、招调查人才可移步一起调研网

一个属于调研行业的B2B网站

第四篇:我们拿什么让物联网云计算落地--《物联网与云计算》杂志

我们拿什么让物联网、云计算落地

从被称为物联网元年的2009年,到2011年,物联网的发展已经走过了两个年头。在这两年的历程中,物联网逐渐从热炒阶段步入务实阶段。“十二五”规划中更是明确了物联网的阶段性发展方向:“推动物联网关键技术研发和在重点领域的应用示范。”工信部苗圩部长在《求是》上发表的署名文章中所指出的“我国物联网发展的思路和重点”之一便是加强产业合作,面向重点领域开展应用。同时,中国物联网界的泰斗,中国工程院秘书长邬贺铨院士也一再强调:物联网与其说是技术不如说是应用。在此影响下,面向行业应用的物联网产品和研发成果也不断涌现。可见,要让物联网云计算落地,“应用为王”已成为业界共识。

然而,我们拿什么让物联网云计算落地呢?

众所周知,在IT、互联网时代,真正的核心技术都掌握在欧美企业手中,中国本土企业除了华为、中兴,几乎都处于最底层的“生产代工”环节,都在做着基于国外技术的二次开发。因此,IT、互联网界的真正的龙头企业也都集中在欧美国家。

物联网时代,所谓中国和世界发展同步。然而,中国是否真的能够突破核心技术瓶颈,在新一轮信息革命中崛起?答案很迷茫。

首先,从中国人的本性来看,这不无可能。春秋战国时代便是大家频出;唐宋到西汉更有举世闻名的“四大发明”。这都说明中国是一个对人类的文明和创新做出过引领性贡献的民族。所以,只要加以善用,假以时日,比肩国际巨头不无可能。

然而,从当下的政治经济环境,以及社会风气来看,又着实困难。自改革开放以来, “一切以经济为中心发展战略”的本意被很多人曲解,致使“中国制造”充满了“抄袭、拷贝、山寨”的低劣味道。并且这种误解,日益加重。还有多少人愿意去潜心做研发,大量的投资都只为能得到快速回报。恨不得把所有行业都当“房地产”来做。试问,如此利欲熏心,身心浮躁,如何担当起在新一代信息技术革命中引领世界之重任?

两者相较,中国人本性中的钻研、踏实正在被一点点磨灭;而急功近利、浮夸务虚的一面却日益放大。因而,我们能够在这一轮的全球性战略发展机遇中积攒起核心竞争力吗?能够真正的与国际行业巨头竞争吗?能够不再仅仅是“市场之王”吗?我们能够用自主可控的解决方案让物联网云计算落地吗?

夜阑卧听风吹雨, 铁马冰河入梦来。中国的物联网发展需要一大批真正的有识之士以敏锐的眼光、实干的精神和本地化的机遇,从物联网全球产业链的竞争合作中脱颖而出。

第五篇:在职研究生专业:大数据与云计算凶猛来袭

或许很多在职人员对大数据专业表现出一种陌生感,但却不能否认大数据时代已渐成气候。中国人民大学在职研究生教育,应时代发展要求,特开设计算机应用技术大数据与云计算在职研究生专业。对于大数据与云计算专业不甚了解?

简单来说,为何淘宝的“猜你喜欢”总能轻而易举地知道你的近期所需,从而精确推送?为何当当网总能猜到你所感兴趣的书籍?为何你的邮箱里总有一些跟你的生活息息相关的广告邮件?当我们在享受大数据与云计算带来的便捷生活方式的同时,却常常没有意识到这就是大数据与云计算,直到手中的移动硬盘由500G增加至1T,再由1T增加至4T,才恍然大悟:原来大数据与云计算浪潮来势如此凶猛。

我们已经生活在被大数据与云计算笼罩的世界中,比如通过分析大数据,预判犯罪行为的发生、寻找灾难中的生还者,微软研究院正利用来自哈勃等全球太空望远镜搜集来的数据和图像建立一幅宇宙地图。“大数据”绝对是时下最火热的IT行业词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等技术,正在为大数据与云计算在职研究生带来大量的商业价值,逐渐成为行业人士争相追捧的利润焦点。

而与之相关的职业需求也呈爆发式增长,大数据职业的相关人才匮乏,人才缺口非常大。盖特纳咨询公司预测大数据与云计算专业将为全球带来440万个IT新岗位和上千万个非IT岗位。

对于在职人员而言,在职研究生报考或许是人生中可遇不可求的机遇,抓住了则会改变命运。在职研究生专业的选择会在很大程度上影响人一生的前途与命运。目前国内从事大数据和云计算研究生专业的学校不多,如北京航空航天大学、上海交大、厦门大学等几家,其中北航软件学院大数据技术与应用专业实力比较强。此专业是北航软件学院、北航计算机学院与工信部移动云计算教育培训中心联合打造的大数据技术与应用专业目前为全国首开,有想读在职研究生的可以考虑。顺着大数据与云计算的时代风潮,尤其是现在此专业的设立不久,定能在将来的工作中抢占先机。

上一篇:物流系统实训报告下一篇:网络信息安全中学