云计算时代数据库

2022-07-24

第一篇:云计算时代数据库

浅谈云计算时代数据中心网络架构变革

当前,网络数据量、用户终端量的激增以及视频互动分享、设备协同、物联网等应用的蓬勃发展,使得市场和产业中需要全新的计算和服务模式。据权威数据统计:预计到2013年,全球互联网流量将达到每月56EB(1EB=1024PB=1024*1024TB),相当于每月在网络上交互128亿张DVD盘片中的内容。到那时,互联网数据中将有约91%的内容是基于视频的,每个人平均使用的终端数量将达到7个,意味着2013年全球用户设备将达到约500亿台。云计算的真正价值在于,它可以基于计算能力的虚拟化和资源调配的自动化,为用户提供虚拟的计算、存储和网络资源,提高设备利用率,保护客户资产投入,带给用户刚好的服务质量。

网络结构的变革

IT的传统角色一直是提供并管理基于技术的性能,即应用程序、数据库、网络、存储和服务器等集合资产。IT是在不同的技术领域通过项目需求开展的经过一个由计划,到创建,再到运行的生命周期。这是一个以交付为导向、以技术为中心的方法。在新一代云的环境下,IT必须重新改造,进入大规模变革阶段,从以技术为中心的架构转变为“以服务为中心”。所谓IT即服务,必须建立在一个动态配置的智能型数据中心基础之上。

传统的数据中心更多是技术的简单堆叠,数据中心建设由业务驱动,一段时间之后会发现,系统变得越来越庞大杂乱,运维管理越来越复杂,资源难以整合和动态调配,不仅导致资源利用率和系统应变能力都极低,而且资产利用率和创新效率也迟迟难以提升。在新一代数据中心中,所有的服务器、存储器,同时也包括网络等基础设施资源将通过虚拟化技术被池化,形成三大共享基础设施资源池:处理池、存储池以及网络池。共享资源池中的资源可按照每一应用系统的需求被初始化分配与快速部署。

在这样一种变革的驱动下,数据中心的网络结构必须经历新一轮的扁平化网络、融合式网络的结构调整,只有这样才能适应整体IT架构因为整合了尽可能多的基础设施而弹性化的需求,各个业务模块之间,IT部门与业务部门之间才能更好地相互协调、相互支撑,为业务的快速发展和创新提供更多的可能性空间, 提升应变能力和生产力。

三层简化为两层 当前,互联网应用呈爆炸性增长,网络流量的分布模式已变得无法预测,用户数量呈指数曲线增长等等,网络环境已经发生巨变,激增的数据量对现有的网络结构和设备提出考验, 快速增长的移动性给网络的可扩展性带来很大压力。同时,网络也变得非常复杂,这使得运营成本非常高。

经过多年的技术演变和业务发展,当前数据中心的网络基础架构通常都是采用树状结构,分为接入层、聚合层和核心层。在大多数情况下,数据流从接入层到聚合层再到核心层,然后再返回,层次越多不仅使用的设备会越多,延迟也会增加。网络中每一跳的代价都很高,而且会增加复杂性。由于这些操作的重复和重叠,无法得到想要的性能,也导致了安全性难以保障。

在传统网络中,是依靠不断添加机器来提升网络性能的,这种方法增加了数据中心的成本和复杂性。在大规模采用服务器虚拟化技术的新一代数据中心里,数据流量将主要集中在本地服务器之间的通信,如果能通过路由器和万兆以太网交换机帮助扁平化网络和简化现有数据中心网络,既可动态及同时支持更多的用户、服务以及带宽,提高性能,也可以帮助用户节省运营时间,减少数据中心网络资本性支出。

未来的数据中心的网络结构会越来越简单,它可能会由原来的三层变成两层,即核心层、边缘层两级架构:由核心层连接云计算数据中心服务器、存储与边缘层设备,执行各边缘层流量汇聚,以及高速数据转发。由于云计算对终端的要求必须尽可能简化,因此要求边缘层设备更加智能化、自动化、多业务融合,例如支持丰富网络接入方式,具备丰富的QoS策略、安全控制策略、应用流量控制、应用加速等业务处理能力。

技术趋势

云计算虚拟化到来,网络核心设备扩展是弹性计算实现最有效方式之一,因此几乎所有网络厂家极力开发提供按需横向扩展的核心层解决方案,核心层设备以100G或40G互联,不过由于横向扩展节点之间也需要超低延迟同步,所以核心机箱横向最大数目有限制,比如4到8台。核心层节点之间无协议转换发生,利用高速转发平面芯片充分利用最大包转发率和带宽极限,达到极速转发。因为核心节点芯片性能高,成本也高,为了降低客户使用成本和利用最大容量,消除生成树协议,提供跨机箱Trunk技术,以并行无生成树协议下联就是来自用户的技术诉求。由于核心节点横向扩展数目有限,为了更高性能或扩展性,厂家同时坚持核心层竖向扩展,提供高密度、高容量和高带宽接入,比如一些厂家单机箱可支持300个万兆、数十个40G。当然边缘层设备也可以按需横向扩展,包括使用虚拟机箱技术或堆叠技术、多链路绑定上联、消除生成树等技术以10G或40G上联到核心。边缘节点接口方面提供高密度、混合多端口一体机顶交换机,混合接口一般支持千兆、万兆、FCoE、FC和iSCSI,并支持TRILL或SPB协议,支持二层路由多路径,接入到二层核心层。边缘节点与计算节点或存储节点相连,通过支持EVB、VEPA等虚拟主机协议智能感知虚拟计算节点,完成虚拟移动性策略漂移。可是边缘层发展情况比较复杂,目前业界还没有边缘层统一标准,各个网络厂家八仙过海,各显神通。除了虚拟计算智能外,边缘层还常常担负网络增强服务角色,比如负载均衡、防火墙、入侵检测和日志记录等,这也是业界发展的重要方向。

第二篇:“大数据时代下的云计算”2013企商云计算研讨会

2013年,云计算产业风起云涌,云计算应用层出不穷。金色的十一月,我们迎来了企商在线举办的“大数据时代下的云计算”研讨会 。此次大会联合了中国计算机报,盛邀云计算用户、云计算和信息化行业专家,共论顺应云计算趋势、应用云计算和大数据带来的优势,来推动企业转型升级,从而提高企业应变能力。

日前,“大数据时代下的云计算”在古老文明与现代文明集于一体的文化殿堂——中国国家图书馆(古籍馆)-临琼楼二楼隆重召开,参加此次云计算研讨会的企业有200余家,涉及媒体、教育、电商、研发公司等行业,到场嘉宾有信息专家、企业代表、技术骨干等行业精英。

企商在线创始人王熠致辞

开场首先由企商在线创始人王总为到场嘉宾致欢迎词,感谢各位到场嘉宾的支持,并借此机会答谢各个行业的新老用户和关心企商在线发展的有识之士。

目前,互联网越来越发达,越来越深入,全民都深度参与到互联网的变革大潮中,大数据的价值变得越来越高。社会的需求推着我们向前走,各个行业都在提云计算,事实证明当时的铺垫为今天的云计算起到了很大的推动作用。但是不能回避的是,大数据的需求也越来越迫切,而且云计算和大数据我们认为是一个天生的关联度很强的两个基因。当把二者放在一个维度上来考虑时,对思路进行重构,对结果进行关联,我们认为需要进行较为深入的探讨。

中国科学院彭赓教授:大数据下的云计算

世界正在逐渐走向物联化(Instrumented)、互联化(Interconnected)和智能化(Intelligent),所有的事物和活动都可以被感测,而感测过程中产生的大量数据又会被输送到后台进行处理,通过庞杂的数据资料,分析出有用的信息,支持和推动决策的有效性。由于数据的来源、传送的方式和使用的方法发生了质的改变,数据利用已经不是用传统的方式把数据输入计算机、通过处理得到报表如此简单。大数据时代下,世界各国将大数据战略提升到国家战略层面,进一步推动了云计算数据中心的广泛应用。

彭教授的话中讲到云计算是一场产业的变革,是即将迎接大数据时代的重要支撑体系,让我们已经充分了解到云计算将重新塑造我们整个IT产业链。

联通运维部副总曹鲁:云计算与大数据的发展实践

为了加速业务的转型和升级,促进移动互联网的发展、推动IT的整合,保障数据的整合集中,从而引发了联通发展云计算和大数据的战略思考。

联通通过采用云技术,以集中大数据为核心,顶层设计引领IT规划建设,服务下沉助力用户感知提升,推动大营销、大服务的一体化建设;构建中国联通统一的大数据服务能力;最终实现对资源弹性调度、安全复用;提高数据价值、密度、效率;应用灵活;保障其真实准确、运营有序。

曹总还向大家展示了提供面向公众的云服务, 包括面向通信录、日历、便签、文件、相册、视频、音乐等文件的同步、备份和分享的功能。

浙江大学宁波理工学院李兴森教授:云计算解决方案助力企业快速增长

李教授针对大家熟悉的云计算,进行了三个层次的服务的细致讲解,让我们知道了云计算是一种能够方便、按需从网络访问共享的可配置计算资源(如,网络、服务器、存储、应用程序和服务)池的模型,且只需最少的管理或服务提供方交互即可快速供应和发布该模型,从而降低复杂度、提升业务敏捷性,降低市场响应时间,推动业务与技术创新、改变IT支出的成本结构。

中搜集团总裁陈沛:云计算的理论与实践

中搜集团是继百度之后国内最大的搜索引擎厂商,总裁陈沛讲到:“社会分工是人类进步的动力。”互联网的技术实施包括软件模式、外包模式、自建模式以及云服务模式。云技术的特点能够轻松实现网站的构筑与管理,颠覆传统建站及网络运营、服务模式,从而使我们知道专业分工更能创造价值。陈总生动讲述了传统行业和互联网行业之间的区别,赢得了各界人士的热烈掌声,将大会推到了高潮。

高峰互动

最精彩的环节当属高峰互动环节,参加互动的嘉宾都是业界大腕,他们分别是东软集团副总裁王立民、中国联通云数据有限公司运维部副总经理曹鲁,戴尔集团的李泰生李总以及浙江大学宁波理工学院李兴森教授。四位嘉宾先后探讨了“带宽是不是云计算应用的瓶颈?”、“虚拟化是云计算IaaS中最重要部分,PaaS是体现云计算价值的核心?”以及“云计算在大数据时代能够起到的重要作用?”。大家对云计算的认知全面提高,现场气氛十分活跃。

此次研讨会是通过梳理云计算终端用户的需求和实践,更有效的促进云计算产业创新经济的发展,充分展示了企商在线的综合实力,企商在线会在今后的发展中不断为各企业提供更优质的产品和最佳的解决方案,让更多的企业感受到企商在线一站式的增值服务。企商在线期待与各界友人的合作!

第三篇:云计算时代

云计算时代“云会议”模式将盛行

2011-03-15 11:14:35 来源:home.donews.com 分享 | 摘要: 曾几何时,我们要传达一个讯息的时候,总是要组织人开会,甚至不惜跋涉很远去参加一个会议,旅途奔波不可避免。后来有了电话会议,尤其是手机····· 关键词: 云计算

曾几何时,我们要传达一个讯息的时候,总是要组织人开会,甚至不惜跋涉很远去参加一个会议,旅途奔波不可避免。后来有了电话会议,尤其是手机流行之后,沟通容易了许多,一些会议也可以通过电话会议或者视频会议解决了。当信息化发展越来越快捷之后,网络会议也成为一种主流,事实上,笔者也经常参加一些知名企业的信息发布会或者财报发布会之类的。这是一种不在现场,也可以有身临其境的感觉,更主要的是方便了许多。

其实,当网络信息成为我们生活中的一种主要应用之后,由此带来的一种机会成本优势正在堆积,更主要的是我们可以节省很多时间和精力。当云概念时代来临之后,我们发现,其实会议也可以进入“云会议”时代。

什么是“云会议”?

云会议其实就是用户只需按照自己喜欢的方式进行开会,而云端看不见的繁琐技术全部留给技术后台来解决。对于用户而言,其实并不需要知晓后台是如何运作的,关键是前台的使用是否便捷,是不是得心应手。这也是信息时代发展中的一种必然变化,也就是说,将视频、电话、网络整合在一起的远程会议产品已经成为一种需求。

如何理解“云会议”?

笔者关注的当然不是云会议的概念,而是应用是否简单?笔者所在单位曾经搭建了自己的视频网络会议,费时费力,成本也不低。在运作的过程中还有很多维护人员。硬件投入、人力维护、财力投入都进行了不少。在效果上也尚可,但是有时候在速度上还是卡。并且应用的时候部门之间容易打架。

那么有没有好的办法解决?起码在成本上更容易控制一些,在使用的过程中也更方便一些,同时能够承载的应用更多一些?其实这也是目前云会议可以帮助我们解决的地方。我们完全可以撇开自建模式,而转而使用第三方平台给我们搭建的模式。通过网络轻松获得数据、图像和声音,从而实现自由通信。这样我们的冗余度会更宽泛一些,自由支配的机会更多,并且更自由。 “云会议”的前景有多大?

有关数据显示,未来三年,我国远程会议规模将增长并超过10 亿人民币,年增长率超过30%。这意味着,一方面中国远程会议市场尽管早已形成,但还远未被用户熟知;另一方面则说明该市场在今后将拥有极大发展潜力。

过去远程会议在中国的使用者主要集中在以世界500 强为主的外企身上,现在国内企业也开始愈加关注。为何会出现这种变化?很简单,国内企业的科技发展和网络应用水准已经达到了一定程度,企业的发展需要这种高效的改变。

尤其是企业发展必然会不断地扩展,在扩展地过程中就会滋生更多的部门和分支机构,如何统辖这些部门和机构,就需要不断地联络和分配任务。这就需要一个良好的沟通桥梁,会议自然就无法避免。

正是因为存在着潜在的发展机会,因此一些企业也开始介入到这个市场。中国电信、中国联通等运营商,思科、IBM、微软等巨头,以及全时、263等国内企业,均染指于远程会议市场。运营商凭借自身的基础通信网络,能够为用户构筑一个平台;不过,这个市场的发展处于起步阶段,运营商的投入并不是很上心。大的设备制造商,也意味着大的价钱,性价比不强。而像全时这种通过出租基于Web的远程会议软件和服务,中小企业客户无需做一次性的大额投入来购买场地、设备和软件,反而获得了更多的市场机会。

“云会议”带来的益处

相信很多人第一想到的就是节约时间,简洁便利。事实也是如此。有调查显示,商务人士们平均每天将2小时的时间花费在会议上,远超过了通过邮件和电话做决策、传达决策的时间。

效能的传达需要不折不扣的执行,而下达命令和任务都需要会议来承载。两年前,Gartner Symposium ITxpo技术大会上,Gartner就曾将云计算和统一通信分别选为“未来十大战略技术”。统一会议服务就成为市场的一种需求。它不但可以为用户降低成本,提高协作,还是实现绿色管理的有效途径,无论从哪个角度上讲,它都将成为商务人士进行会议办公的必备工具。

随着“云”计算技术的成熟,“云”的相关业务快速普及,企业信息化将由“无纸办公”阶段向“无IT基础设施”的更高阶段迈进。“云会议”无疑也是这个进程中极具普及价值的远程协作解决方案。

“云会议”的商业应用前景如何?

众所周知,随着商务时代的来临,我们看到越来越多的中小企业开始崛起,他们崛起之后的市场布局也会成为未来商业市场的一种草根群体,虽然单独地看它们或许并不强大,但是他们以蝼蚁之众可以汇聚起极大的力量,聚沙成塔集腋成裘,这就是一个可贵的商机。

随着信息化对人们生产生活的进一步渗透,未来的企业一定是将非核心统统剥离交予第三方服务,企业只关心最核心的价值。就如同我们知晓的第三方支付一样,在起步阶段,我们也并不看好其发展前景,但事实证明,第三方支付带来的便捷是银行都无法替代的。这就是看似一个小的市场却能撬动大的变化。

当市场需求旺盛的时候,当第三方运营商已经能够给市场推出积极有效的平台之后,我们的企业还需要自己搭建平台吗?很显然,最好的办法就是直接使用即可,因为这样付出的成本将更低,对企业集中精力和成本优势进行市场布局也是大有裨益的。云会议无疑就是这样一种可以利用的平台,它的发展前景也必然是可期待的。

第四篇:大数据与云计算

摘 要:大数据(Big Data)这个概念近年来在越来越多的场合、被越来越多的人提及, 并且经常和云计算联系在一起,云计算与大数据之间到底是什么关系成为热点话题。本

专题报告包含以下四个方面内容:1. 大数据的价值;2. 大数据带来的挑战;3. 大数据研究成果;4. 云计算是大数据挖掘的主流方式。通过本报告阐述我们对大数据的理解,以及对大数据的价值的认识,探讨大数据处理与挖掘技术,大数据主要着眼于“数据”,提供数据采集、挖掘、分析的技术和方法; 云计算技术主要关注“计算”,提供IT 解决方案。大数据、云计算技术可以促进持续审计方式的发展、总体审计模式的应用、审计成果的综合应用、相关关系证据的应用、高效数据审计的发展和大数据审计师的发展。强化大数据、云计算技术审计应用的措施包括制定长远发展战略、加快审计法规建设、建立行业平台、加强研发和提高利用能力。 关键词:大数据 云计算 数据挖掘 对审计影响 政策建议 引言

目前,大数据伴随着云计算技术的发展,正在对全球经济社会生活产生巨大的影响。大数据、云计算技术给现代审计提供了新的技术和方法,要求审计组织和审计人员把握大数据、云计算技术的内容与特征,促进现代审计技术和方法的进一步发展。

一、大数据、云计算的涵义与特征

随着云计算技术的出现,大数据吸引了全世界越来越多的关注。哈佛大学社会学教授加里·金 ( 2012) 说: “这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。” ( 一) 大数据的涵义与特征

“数据”( data) 这个词在拉丁文里是“已知”的意思,也可以理解为“事实”。2009 年,“大数据”概念才逐渐开始在社会上传播。而“大数据”概念真正变得火爆,却是因为美国奥巴马政府在2012 年高调宣布了其“大数据研究和开发计划”。这标志着“大数据”时代真正开始进入社会经济生活中来了。“大数据”( big data) ,或称巨量资料,指的是所涉及的数据量规模大到无法利用现行主流软件工具,在一定的时间内实现收集、分析、处理或转化成为帮助决策者决策的可用信息。互联网数据中心( IDC)认为“大数据”是为了更经济、更有效地从高频率、大容量、不同结构和类型的数据中获取价值而设计的新一代架构和技术,用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。大数据具有4 个特点: 第一,数据体量巨大( Volume) ,从TB 级别跃升到PB 级别。第二,处理速度快( Velocity) ,这与传统的数据挖掘技术有着本质的不同。第三,数据种类多( Variety) ,有图片、地理位置信息、视频、网络日志等多种形式。第四,价值密度低,商业价值高( Value) 。存在单一数据的价值并不大,但将相关数据聚集在一起,就会有很高的商业价值( 金良,2012) 。大数据时代,不仅改变了传统的数据采集、处理和应用技术与方法,还促使人们思维方式的改变。大数据的精髓在于促使人们在采集、处理和使用数据时思维的转变,这些转变将改变人们理解和研究社会经济现象的技术和方法。

(1)是在大数据时代,不依赖抽样分析,而可以采集和处理事物整体的全部数据。19 世纪以来,当面临大的样本量时,人们都主要依靠抽样来分析总体。但是,抽样技术是在数据缺乏和取得数据受限制的条件下不得不采用的一种方法,这其实是一种人为的限制。过去,因为记录、储存和分析数据的工具不够科学,只能收集少量数据进行分析。如今,科学技术条件已经有了很大的提高,虽然人类可以处理的数据依然是有限的,但是可以处理的数据量已经大量增加,而且未来会越来越多。随着大数据分析取代抽样分析,社会科学不再单纯依赖于抽样调查和分析实证数据,现在可以收集过去无法收集到的数据,更重要的是,现在可以不再依赖抽样分析。

(2)是在大数据时代,不再热衷于追求数据的精确度,而是追求利用数据的效率。当测量事物的能力受限制时,关注的是获取最精确的结果。但是,在大数据时代,追求精确度已经既无必要又不可行,甚至变得不受欢迎。大数据纷繁多样,优劣掺杂,精准度已不再是分析事物总体的主要手段。拥有了大数据,不再需要对一个事物的现象深究,只要掌握事物的大致发展趋势即可,更重要的是追求数据的及时性和使用效率。与依赖于小数据和精确性的时代相比较,大数据更注重数据的完整性和混杂性,帮助人们进一步认识事物的全貌和真相。

(3)是在大数据时代,人们难以寻求事物直接的因果关系,而是深入认识和利用事物的相关关系。长期以来,寻找因果关系是人类发展过程中形成的传统习惯。寻求因果关系即使很困难且用途不大,但人们无法摆脱认识的传统思维。在大数据时代,人们不必将主要精力放在事物之间因果关系的分析上,而是将主要精力放在寻找事物之间的相关关系上。事物之间的相关关系可能不会准确地告知事物发生的内在原因,但是它会提醒人们事情之间的相互联系。人们可以通过找到一个事物的良好相关关系,帮助其捕捉到事物的现在和预测未来。 ( 二) 云计算的涵义与特征

“云计算”概念产生于谷歌和IBM 等大型互联网公司处理海量数据的实践。2006 年8 月9 日,Google首席执行官埃里克·施密特( Eric Schmidt) 在搜索引擎大会首次提出“云计算”的概念。2007 年10 月,Google 与IBM 开始在美国大学校园推广云计算技术的计划,这项计划希望能降低分布式计算技术在学术研究方面的成本,并为这些大学提供相关的软硬件设备及技术支持( Michael Mille,2009) 。目前全世界关于“云计算”的定义有很多。“云计算”是基于互联网的相关服务的增加、使用和交付模式,是通过互联网来提供动态易扩展且经常是虚拟化的资源。美国国家标准技术研究院( NIST) 2009年关于云计算的定义是: “云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池( 资源包括网络、服务器、存储、应用软件、服务等) ,这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。”根据这一定义,云计算的特征主要表现为: 首先,云计算是一种计算模式,具有时间和网络存储的功能。其次,云计算是一条接入路径,通过广泛接入网络以获取计算能力,通过标准机制进行访问。第三,云计算是一个资源池,云计算服务提供商的计算资源,通过多租户模式为不同用户提供服务,并根据用户的需求动态提供不同的物理的或虚拟的资源。第四,云计算是一系列伸缩技术,在信息化和互联网环境下的计算规模可以快速扩大或缩小,计算能力可以快速、弹性获得。第五,云计算是一项可计量的服务,云计算资源的使用情况可以通过云计算系统检测、控制、计量,以自动控制和优化资源使用。 ( 三) 大数据与云计算的关系

从整体上看,大数据与云计算是相辅相成的。大数据主要专注实际业务,着眼于“数据”,提供数据采集、挖掘、分析的技术和方法,强调的是数据存储能力。云计算主要关注“计算”,关注IT 架构,提供IT 解决方案,强调的是计算能力,即数据处理能力。如果没有大数据的数据存储,那么云计算的计算能力再强大,也难以找到用武之地; 如果没有云计算的数据处理能力,则大数据的数据存储再丰富,也终究难以用于实践中去。

从技术上看,大数据依赖于云计算。海量数据存储技术、海量数据管理技术、MapReduce 编程模型都是云计算的关键技术,也都是大数据的技术基础。而数据之所以会变“大”,最重要的便是云计算提供的技术平台。数据被放到“云”上之后,打破了过去那种各自分割的数据存储,更容易被收集和获得,大数据才能呈现在人们眼前。而巨量的数据也只能依靠云计算强大的数据处理能力,才能够“淘尽黄沙始得金”。

从侧重点看,大数据与云计算的侧重点不同。大数据的侧重点是各种数据,广泛、深入挖掘巨量数据,发现数据中的价值,迫使企业从“业务驱动”转变为“数据驱动”。而云计算主要通过互联网广泛获取、扩展和管理计算及存储资源和能力,其侧重点是IT 资源、处理能力和各种应用,以帮助企业节省IT部署成本。云计算使企业的IT 部门受益,而大数据使企业的业务管理部门受益。

从结果看,大数据与云计算带来不同的变化。大数据对社会经济带来的变化是巨大的,涉及到各个领域。大数据已经与资本、人力一起作为生产的主要因素影响着社会经济的发展。数据创造价值,而挖掘数据价值、利用数据的“推动力”就是云计算。云计算将信息存储、分享和挖掘能力极大提高,更经济、高效地将巨量、高速、多变的终端数据存储下来,并随时进行计算与分析。通过云计算对大数据进行分析、总结与预测,会使得决策更可靠,释放出更多大数据的内在价值。

二、大数据、云计算技术对审计的影响分析

审计技术和方法的发展是随着科学和管理技术的发展而发展的。现代审计技术和方法体系是在原始的查账基础上从低级向高级、从不完备到比较完备发展起来的。在业务和会计处理手工操作阶段,审计实施的是账表导向的审计技术和方法; 当内部控制理论和方法全面应用于业务和会计处理时,审计实施的是系统导向的审计技术和方法; 当风险管理理论和方法全面应用于业务和财务管理时,审计实施的是风险导向审计技术和方法; 与风险导向审计技术和方法并行的是,计算机技术广泛应用于业务和会计处理时,审计实施的是IT 审计技术和方法。目前,面对大数据、云计算技术的产生和发展,审计人员需要应时而变来适应由此而带来的变化,分析大数据、云计算技术对审计方式、审计抽样技术、审计报告模式、审计证据搜集等技术和方法的影响。 ( 一) 大数据、云计算技术促进持续审计方式的发展

传统审计中,审计人员只是在被审计单位业务完成后才进行审计,而且审计过程中并不是审计所有的数据和信息,只是抽取其中有的一部分进行审计。这种事后和有限的审计对被审计单位复杂的生产经营和管理系统来说很难及时做出正确的评价,而且对于评价日益频繁和复杂的经营管理活动的真实性和合法性则显得过于迟缓。随着信息技术迅速发展,越来越多的审计组织对被审计单位开始实施持续审计方式,以解决审计结果与经济活动的时差问题。但是,审计人员实施持续审计时,往往受目前业务条件和信息化手段的限制,取得的非结构化数据无法数据化,或者无法取得相关的明细数据,致使对问题的判断也难以进一步具体和深入。而大数据、云计算技术可以促进持续审计方式的发展,使信息技术与大数据、云计算技术较好交叉融合,尤其对业务数据和风险控制“实时性”要求较高的特定行业,如银行、证券、保险等行业,在这些行业中实施持续审计迫在眉睫。如审计组织对商业银行的审计,实行与商业银行建立业务和数据系统的接口,在开发的持续审计系统中固化了非结构化数据结构化和数据分析模块,该模块可以在海量贷款客户中挖掘、分析出行业性和区域性贷款风险趋势,实现在线的风险预警,并将发现的风险数据、超预警值指标及问题登记为疑点,并建立实时审计工作底稿,按照重要程度进行归类、核实或下发给现场审计人员进行现场核实,以较好处理非结构化数据的利用和数据的实时分析利用问题。 ( 二) 大数据、云计算技术促进总体审计模式的应用

现时的审计模式是在评价被审计单位风险基础上实施抽样审计。在不可能收集和分析被审计单位全部经济业务数据的情况下,现时的审计模式主要依赖于审计抽样,从局部入手推断整体,即从抽取的样本着手进行审计,再据此推断审计对象的整体情况。这种抽样审计模式,由于抽取样本的有限性,而忽视了大量和具体的业务活动,使审计人员无法完全发现和揭示被审计单位的重大舞弊行为,隐藏着重大的审计风险。而大数据、云计算技术对审计人员而言,不仅仅是一种可供采用的技术手段,这些技术和方法将给审计人员提供实施总体审计模式的可行性。利用大数据、云计算技术,对数据的跨行业、跨企业搜集和分析,可以不用随机抽样方法,而采用搜集和分析被审计单位所有数据的总体审计模式。利用大数据、云计算技术的总体审计模式是要分析与审计对象相关的所有数据,使得审计人员可以建立总体审计的思维模式,可以使现代审计获得革命性的变化。审计人员实施总体审计模式,可以规避审计抽样风险。如果能够收集总体的所有数据,就能看到更细微、深入的信息,对数据进行多角度的深层次分析,从而发现隐藏在细节数据中的对审计问题更具价值的信息。同时,审计人员实施总体审计模式,能发现从审计抽样模式所不能发现的问题。大数据、云计算技术给审计人员提供了一种能够从总体把握审计对象的技术手段,从而帮助审计人员能从总体的视角发现以前难以发现的问题。

( 三) 大数据、云计算技术促进审计成果的综合应用

目前,审计人员的审计成果主要是提供给被审计单位的审计报告,其格式固定,内容单一,包含的信息量较少。随着大数据、云计算技术在审计中广泛应用,审计人员的审计成果除了审计报告外,还有在审计过程中采集、挖掘、分析和处理的大量的资料和数据,可以提供给被审计单位用于改进经营管理,促进审计成果的综合应用,提高审计成果的综合应用效果。首先,审计人员通过对审计中获取的大量数据和相关情况资料的汇总、归纳,从中找出财务、业务和经营管理等方面的内在规律、共性问题和发展趋势,通过汇总归纳宏观性和综合性较强的审计信息,为被审计单位投资者和其他利益相关者提供数据证明、关联分析和决策建议,从而促进被审计单位管理水平的提高。其次,审计人员通过应用大数据、云计算技术,可以将同一问题归入不同的类别进行分析和处理,从不同的角度、不同的层面整合提炼以满足不同层次的需求。再次,审计人员将审计成果进行智能化留存,通过大数据、云计算技术,将问题规则化并固化到系统中,以便于计算或判断问题发展趋势,向被审计单位进行预警。最后。审计人员将审计成果、被审计单位与审计问题进行关联,并进行信息化处理,在进行下次审计时,减少实地审计的时间和工作量,提高审计工作的效率。 ( 四) 大数据、云计算技术促进相关关系证据的应用

审计人员在审计过程中,应根据充分、适当的审计证据发表审计意见,出具审计报告。但是,在大数据、云计算环境下,审计人员既面临巨量数据筛选的考验,又面临搜集适当审计证据的挑战。审计人员在搜集审计证据时,传统的思维路径都是基于因果关系来搜集审计证据,而大数据分析将会更多地运用相关关系分析来搜集和发现审计证据。但从审计证据发现的角度来看,由于大数据技术提供了前所未有的跨领域、可供量化的维度,使得审计问题大量的相关信息能够得以记录和计算分析。大数据、云计算技术没有改变事物间的因果关系,但在大数据、云计算技术中对相关关系的开发和利用,使得数据分析对因果逻辑关系的依赖降低了,甚至更多地倾向于应用基于相关关系的数据分析,以相关关系分析为基础的验证是大数据、云计算技术的一项重要特征。在大数据、云计算技术环境下,审计人员能搜集到的审计证据大多是电子证据( 秦荣生,2013) 。电子证据本身就非常复杂,云计算技术使获取有因果关系的证据更加困难。审计人员应从长期依赖因果关系来搜集和发现审计证据,转变成为利用相关关系来搜集和发现审计证据。 ( 五) 大数据、云计算技术促进高效数据审计的发展

直到今天,审计人员的数字审计技术依然建立在精准的基础上。这种思维方式适用于掌握“小数据量”的情况,因为需要分析的数据很少,所以审计人员必须尽可能精准地量化被审计单位的业务。随着大数据、云计算技术成为日常生活中的一部分,审计人员应开始从一个比以前更大、更全面的角度来理解被审计单位,将“样本= 总体”植入审计人员的思维中。相比依赖于小数据和精确性的时代,大数据更强调数据的完整性和混杂性,帮助审计人员进一步接近事情的真相,“局部”和“精确”将不再是审计人员追求的目标,审计人员追求的是事物的“全貌”和“高效”。围绕大数据,一批新兴的数据挖掘、数据存储、数据处理与分析技术将不断涌现。在实施审计时,审计人员应利用大数据、云计算技术,使用分布式拓朴结构、云数据库、联网审计、数据挖掘等新型的技术手段和工具,以提高审计的效率。

( 六) 大数据、云计算技术促进大数据审计师的发展

大数据、云计算时代,数据的真实、可靠是大数据发挥作用的前提。这客观上要求专业人员来对大数据的真实性、可靠性进行鉴证,审计人员可以扮演这种角色,或者称为数据审计师。能对大数据真实性、可靠性进行鉴证的数据审计师应该是计算机科学、数学、统计学和审计学领域的专家,他们应有大数据分析和预测的评估能力。数据审计师应恪守公正的立场和严守保密的原则,面对海量的数据和纷繁复杂的相关关系,选取分析和预测工具,以及解读数据及数据计算结果是否真实、可靠。一旦出现争议,数据审计师有权审查与分析结果相关的运算法则、统计方法以及数据采集、挖掘和处理过程。数据审计师的出现是为满足以市场为导向来解决数据真实性、可靠性问题的需求,这与20 世纪初期为了处理财务信息虚假而出现的审计人员一样,都是为了满足新需求而出现的。

三、大数据挖掘

数据的价值只有通过数据挖掘才能从低价值密度的数据中发现其潜在价值,而大数据挖掘技术的实现离不开云计算技术。在业界,全球著名的Google、EMC、惠普、IBM、微软等互联网公司都已经意识到大数据挖掘的重要意义。上述IT 巨头们纷纷通过收购大数据分析公司,进行技术整合,希望从大数据中挖掘更多的商业价值。数据挖掘通常需要遍历训练数据获得相关的统计信息,用于求解或优化模型参数,在大规模数据上进行频繁的数据访问需要耗费大量运算时间。数据挖掘领域长期受益于并行算法和架构的使用,使得性能逐渐提升。过去15 年来,效果尤其显著。试图将这些进步结合起来,并且提炼。GPU 平台从并行上得到的性能提升十分显著。这些GPU 平台由于采用并行架构,使用并行编程方法,使得计算能力呈几何级数增长。即便是图形处理、游戏编程是公认的复杂,它们也从并行化受益颇多。研究显示数据挖掘、图遍历、有限状态机是并行化未来的热门方向。MapReduce 框架已经被证明是提升GPU 运行数据挖掘算法性能的重要工具。D.Luo 等提出一种非平凡的策略用来并行一系列数据挖掘与数据挖掘问题,包括一类分类SVM 和两类分类SVM,非负最小二乘问题,及L1 正则化回归(lasso)问题。由此得到的乘法算法,可以被直截了当地在如MapReduce 和CUDA 的并行计算环境中实现。K. Shim 在MapReduce 框架下,讨论如何设计高MapReduce 算法,对当前一些基于MapReduce 的数据挖掘和数据挖掘算法进行归纳总结,以便进行大数据的分析。Junbo Zhang 等提出一种新的大数据挖掘技术,即利用MapRedue 实现并行的基于粗糙集的知识获取算法,还提出了下一步的研究方向,即集中于用基于并行技术的粗糙集算法处理非结构化数据。F.Gao 提出了一种新的近似算法使基于核的数据挖掘算法可以有效的处理大规模数据集。当前的基于核的数据挖掘算法由于需要计算核矩阵面临着可伸缩性问题,计算核矩阵需要O(N2 ) 的时间和空间复杂度来计算和存储。该算法计算核矩阵时大幅度降低计算和内存开销,而且并没有明显影响结果的精确度。此外,通过折中结果的一些精度可以控制近似水平。它独立于随后使用的数据挖掘算法并且可以被它们使用。为了阐明近似算法的效果,在其上开发了一个变种的谱聚类算法,此外设计了一个所提出算法的基于MapReduce 的实现。在合成和真实数据集上的实验结果显示,所提出的算法可以获得显著的时间和空间节省。Christian Kaiser 等还利用MapReduce 框架分布式实现了训练一系列核函数学习机,该方法适用于基于核的分类和回归。Christian Kaiser 还介绍了一种扩展版的区域到点建模方法,来适应来自空间区域的大量数据。Yael Ben-Haim 研究了三种MapReduce 实现架构下并行决策树分类算法的设计, 并在Phoenix 共享内存架构上对SPRINT 算法进行了具体的并行实现。F. Yan 考虑了潜在狄利克雷分配(LDA) 的两种推理方法——塌缩吉布斯采样(collapsed Gibbssampling,CGS)和塌缩变分贝叶斯推理(collapsedvariational Bayesian,CVB)在GPU 上的并行化问题。为解决GPU 上的有限内存限制问题,F. Yan 提出一种能有效降低内存开销的新颖数据划分方案。这种划分方案也能平衡多重处理器的计算开销,并能容易地避免内存访问冲突。他们使用数据流来处理超大的数据集。大量实验表明F. Yan 的并行推理方法得到的LDA 模型一贯地具有与串行推理方法相同的预测能力;但在一个有30 个多核处理器的GPU 上,CGS 方法得到了26倍的加速,CVB 方法得到了196 倍的加速。他们提出的划分方案和数据流方式使他们的方法在有更多多重处理器时可伸缩,而且可被作为通用技术来并行其它数据挖掘模型。Bao-Liang Lu 提出了一种并行的支持向量机,称为最小最大模块化网络(M3),它是基“分而治之”的思想解决大规模问题的有效的学习算法。针对异构云中进行大数据分析服务的并行化问题G.Jung 提出了最大覆盖装箱算法来决定系统中多少节点、哪些节点应该应用于大数据分析的并行执行。这种方法可以使大数据进行分配使得各个计算节点可以同步的结束计算,并且使数据块的传输可以和上一个块的计算进行重叠来节省时间。实验表明,这种方法比其他的方法可以提高大约60% 的性能。在分布式系统方面,Cheng 等人 提出一个面向大规模可伸缩数据分析的可伸缩的分布式系统——GLADE。GLADE 通过用户自定义聚合(UDA)接口并且在输入数据上有效地运行来进行数据分析。文章从两个方面来论证了系统的有效性。第一,文章展示了如何使用一系列分析功能来完成数据处理。第二,文章将GLADE 与两种不同类型的系统进行比较:一个用UDA 进行改良的关系型数据库(PostgreSQL)和MapReduce(Hadoop)。然后从运行结果、伸缩性以及运行时间上对不同类型的系统进行了比较。

四、总结 大数据的超大容量自然需要容量大,速度快,安全的存储,满足这种要求的存储离不开云计算。高速产生的大数据只有通过云计算的方式才能在可等待的时间内对其进行处理。同时,云计算是提高对大数据的分析与理解能力的一个可行方案。大数据的价值也只有通

过数据挖掘才能从低价值密度的数据中发现其潜在价值,而大数据挖掘技术的实现离不开云计算技术。总之,云计算是大数据处理的核心支撑技术,是大数据挖掘的主流方式。没有互联网,就没有虚拟化技术为核心的云计算技术,没有云计算就没有大数据处理的支撑技术。

参考文献

秦荣生. 大数据、云计算技术对审计的影响研究 何清. 大数据与云计算

张为民. 云计算: 深刻改变未来

文峰. 云计算与云审计———关于未来审计的概念与框架的一些思考

Big data and cloud computing Big Data (Big Data) in recent years, more and more occasions, the concept is mentioned more and more people, And often, and cloud computing together, what is the relationship between cloud computing and big data become a hot topic. this Special report contains the following four aspects: 1. The value of big data; 2. Big data challenge; 3. Big data research; 4. Cloud computing is the mainstream way of data mining. Through this report on our understanding of big data, as well as the understanding of the value of big data, large data processing and mining technology, large data mainly focus on "data", provide the technology and methods of data collection, mining and analysis; Cloud computing technology focusing on "computing", providing IT solutions. Big data and cloud computing technology can promote the development of continuous audit mode, the overall audit mode of application, the audit results of comprehensive application, the application of related evidence, the development of efficient data audit and the development of large data auditor. Strengthen big data and cloud computing technology measures of audit applications include set up long-term development strategy, accelerate the construction of the audit regulations, establish a platform, to strengthen research and development and improve the utilization ability. Keywords: big data cloud computing data mining impact on the audit policy Suggestions

第五篇:云计算数据中心引发传统数据中心变革

云计算数据中心是支撑云服务实现用户转变到客户的数据中心,是一系列新技术集中应用和面向业务服务运营管理的集中体现。云计算数据中心采用虚拟化、自动化、并行计算、安全策略以及能源管理等新技术,解决目前数据中心存在的成本增加过快和能源消耗过度等问题;通过标准化、模块化、动态弹性部署和自助服务的架构方式实现对业务服务的敏捷响应和服务的按需获取。

1、云计算数据中心的构成

云计算数据中心本质上由云计算平台和云计算服务构成。云计算服务包括通过各种通信手段提供给用户的应用、软件、工具以及计算资源服务等;云计算平台包括用来支撑这些服务的安全可靠和高效运营的软硬件平台。通过云计算平台将一个或多个数据中心的软硬件整合起来,形成一种分层的虚拟计算资源池,并提供可动态调配和平滑扩展的计算、存储和网络通信能力,用以支撑云计算服务的实现。

2014-2019年广东物联网云计算行业趋势分析及投2014-2018年云计算行业招商计划书2014年版云计算项目融资商业计划书 2014-2018年中国云计算第三方软件行业市场深度2014-2018年中国政府云计算行业市场深度调研及2014-2018年中国云计算行业市场竞争格局分析与2014-2018中国云计算产业园区行业竞争格局分析2014-2018年中国云计算行业市场深度调研与发展云计算服务是云计算中心的外在实现,包括互联网(internet)、应用软件(saas)、系统平台(paas)和计算资源(iaas)等服务,其特点是无需前期投资、按需租用服务、获取方式简单以及使用安全可靠等,可以满足不同规模的用户根据需要动态地扩展其服务内容。

云计算平台是云计算中心的内部支撑,处于云计算技术体系的核心。它以数据为中心,以虚拟化和调度技术为手段,通过建立物理的、可缩放的、可调配的、可绑定的计算资源池,整合分布在网络上的服务器集群、存储群等,结合可动态分配和平滑扩展资源的能力,提供安全可靠的各种应用数据服务。

2、云计算数据中心的实施过程

云计算数据中心的实施不是一个简单的软硬件集成项目,在实施之前需要谨慎评估和整体规划,充分考虑云计算数据中心的管理模式,并将未来的运营模式纳入到整体规划中,这样才可以充分发挥云计算平台作用。

结合对云计算中心用户需求的调研和国外的实施经验,目前云计算数据中心基础架构实施主要分为以下5个阶段:

1)规划阶段:要将云计算中心建设作为战略问题来对待,管理高层要给予极大的重视和支持,并明确每一阶段所要实现的目标,从业务创新和it服务转型的高度进行规划和部署。

2)准备阶段:根据本行业特性,充分了解用户采用云计算数据中心想要获得的服务与应用需求,并对云计算平台进行充分的评估,选择合适的技术架构。同时充分考虑系统扩展和迁移的可操作性,保证基础设施平台技术的连续性和核心业务的连续性。

3)实施阶段:资源虚拟化是云计算中心的基础,通过构建支持异构平台的虚拟化平台,可以满足安全性、可靠性、扩展性和灵活性等各方面的服务要求。

4)深化阶段:在实现平台架构虚拟化的基础上,还要实现各种资源调度和分配的自动化,为全面管理和自助服务打好基础。

5)应用和管理阶段:云计算的基本特征是开放性,云计算平台应能提供标准的api实现与现有应用兼容。所有的应用移植是渐进过程,云计算基础架构要很好的支撑核心应用,而并不仅仅是新增的需求。同时,云计算平台建设是个闭环的过程,需要进行不断地改进。

3、云计算数据中心的关键技术

云计算数据中心的建设融合了很多新的技术,主要包括以下几个方面。

1)虚拟化技术

虚拟化技术的应用领域涉及服务器、存储、网络、应用和桌面等多个方面,不同类型的虚拟化技术从不同角度解决不同的系统性能问题。

服务器虚拟化对服务器资源进行快速划分和动态部署,从而降低了系统的复杂度,消除了设备无序蔓延,并达到减少运营成本、提高资产利用率的目的。

存储虚拟化将存储资源集中到一个大容量的资源池并进行统一管理,实现无需中断应用即可改变存储系统和数据迁移,提高了整个系统的动态适应能力。

网络虚拟化通过将一个物理网络节点虚拟成多个节点以及将多台交换机整合成一台虚拟的交换机来增加连接数量并降低网络复杂度,实现网络的容量优化。

应用虚拟化通过将资源动态分配到最需要的地方来帮助改进服务交付能力,并提高了应用的可用性和性能。

云计算数据中心基于上述虚拟化技术实现了跨越it架构的全系统虚拟化,对所有资源进行统一管理、调配和监控,在无需扩展重要物理资源的前提下,简单而有效地将大量分散的、没有得到充分利用的物理资源整合成单一的大型虚拟资源,并使其能长时间高效运行,从而能源效率和资源利用率达到最大化。

2)弹性伸缩和动态调配

弹性伸缩可以从纵向和横向两个方面考虑。纵向伸缩性是指在同一个逻辑单元内增加资源来提高处理能力,如:在现有服务器上增加cpu或在现有的raid/san存储中增加硬盘等;横向伸缩性是指增加更多逻辑单元的资源,并整合成如同一个单元在工作。

动态调配是根据需求的变化,对计算资源自动地进行分配和管理,实现高度“弹性”的缩放和优化使用,而使用者不介入具体操作流程。

3)高效、可靠的数据传输交换和事件处理

数据传输交换和事件处理系统是云计算中心的消息和数据传输交换枢纽,不能仅采用组播协议来追求速度,也不能仅采用tcp来追求可靠性,而需要结合多种协议的优势,有效控制分布在网络上的众多组件之间的数据流向,保证数据通道的畅通性、信息交换的可靠性和安全性。同时,为了满足系统应用的多样性和业务实时性要求,设计中也要考虑点对点、点对多点、多点对多点等多种连接方式。

上一篇:寓教于乐乐中求学下一篇:应急管理工作汇报