云计算数据论文范文

2022-05-14

今天小编为大家精心挑选了关于《云计算数据论文范文(精选3篇)》,供大家参考借鉴,希望可以帮助到有需要的朋友。摘要:针对大数据云计算环境下的数据安全问题进行分析,突出表现在数据访问安全、数据隔离安全及数据销毁安全等方面。结合大数据云计算环境下的数据安全管理需求,提出针对性的管理与防范对策,以期能够优化数据管理的效果,降低数据安全问题的发生率。

第一篇:云计算数据论文范文

基于云计算的数据挖掘技术

1、前言

毫无疑问,21世纪10年代,已经是不折不扣的信息时代,或者也可以称之为数据时代。随着计算机的发展,网络的快速普及,尤其是移动互联网在近年来的蓬勃发展,数据量、信息量无时无刻不在海量增长着。目前,面对海量的信息,找出自己真正感兴趣的内容已经成为用户最为头疼的事情,数据挖掘已经成为当前最为热门的技术领域。近年来,云计算成为广受关注的技术领域,也使得数据挖掘平台有了新的发展方向,构建新一代的数据挖掘平台来应对数据的日趋复杂庞大成为可能。云计算实为传统计算机技术与网络技术融合的产物。云计算并非简单的计算,它是新型计算方式、数据存储方式、备份方式、网络资源分配方式的综合体,是基于互联网的相关服务的增加、使用和交付模式。传统的数据挖掘技术是建立在数据库之上的,是通过对已收集数据信息的计算,找出隐藏在不同数据中的相关信息。传统的数据挖掘技术需要在海量数据的基础上进行大量的数据访问与统计计算,在对数据进行挖掘的过程中需要消耗及占用大量的计算以及存储资源,面对规模不断增长的海量数据,需要消耗及占用大量计算及存储资源的传统数据挖掘技术显得越来越力不从心,难以胜任。而云计算独特的计算模式,为海量数据的挖掘提供了一种新的解决方案。

2、云计算与数据挖掘

2.1云计算。云计算是基于互联网的一种商业计算模式,对于云计算的定义,目前并没有一个统一的说法,现阶段广为人接受的是美国国家标准与技术研究院对云计算所做出的定义,即:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。从云计算的定义我们可以知道,云计算拥有可配置的、大型的计算资源共享池,这种资源共享池包括了网络、服务器、存储器、应用软件以及服务。那也就是说,云计算就是对计算资源共享池的一种资源分配技术或服务,它的特点是可以快速提供这些计算资源,可以减少客户的管理工作。云计算将计算任务分布在了由大量计算机或服务器构成的共享资源池上,大大提高了资源的有效利用,使计算处理能力以及存储能力等得到了提高,并且具有更好的扩展性。云计算具有虚拟化的特点,用户不再受到地理位置以及终端设备的限制,只要接入互联网,即可获取所请求的应用服务,也就是说,用户只需要拥有一台可以接入互联网的终端设备,即可获利所需要的各种应用服务;云计算拥有通用性的特点,云平台可以构造出千万种应用,用户没有应用限制,在同一个云平台即可运行不同的应用;云计算具有超大规模以及高扩展性的特点,对于云计算来说,云的规模扩展不会影响用户应用服务的质量,而目前,云计算的规模已经发展出了超大型,如谷歌的云计算已经拥有了上百万台的服务器;云计算拥有高可靠性以及经济性好的特点,多副本容错、多计算节点同构可互换等技术确保了服务的高可靠性,而云计算采用廉价的节点构成云,自动化集中式管理相较于企业传统的数据中心管理成本来说,经济性能十分优越。

2.2数据挖掘。数据挖掘是数据库知识发现中的一个步骤,数据挖掘又被称为数据采矿,顾名思义,数据挖掘就是在已有的海量数据中通过特定的算法来挖掘、发现有用信息或知识的过程。数据挖掘是为了解决需求的问题,也是为了解决数据管理的问题。数据挖掘对于信息产业界来说,是产生价值的关键环节,只有将数据转换成具有应用价值的信息或是知识,才能具有实在商业价值。传统的数据挖掘技术是建立在数据库的基础之上的,需要数据库系统提供有效的存储、索引和查询处理支持,而高性能的计算技术是对海量数据进行处理的关键支撑,在处理效率方面具有重要影响。随着互联网规模的不断扩大以及移动互联网的兴趣,数据规模呈现更快的增长速度,而对于数据挖掘的需求也日益增多,这使得传统的数据挖掘技术暴露出一些问题,首先是数据挖掘效率的问题,传统的基于数据库的数据挖掘技术在面对如今海量数据的增长规模已经很难高效的完成计算分析任务;其次,面对海量数据规模的增长,传统的数据挖掘技术需要更高的软硬件成本的支持,这种成本的支撑面对数据量的大规模增长是长期性的;第三,传统的基于数据系统的数据挖掘技术平台架构,已经无法为挖掘算法能力的提升提供更多支持,算法受限于系统架构影响了数据挖掘技术的发展。

3、基于云计算的数据挖掘关键技术

云计算的出现为数据挖掘技术的发展提供了新的方向,数据挖掘技术基于云计算可以发展出新的模式,就具体的实现来说,其中几个关键技术的发展至关重要。

3.1云计算技术。分布式计算是云计算平台的关键技术,是目前应对海量数据挖掘任务,提高数据挖掘效率的有效手段之一。分布式计算包含分布式存储和并行计算两方面内容,分布式存储有效解决了海量数据的存储问题,实现了数据存储高容错、高安全、高性能等关键功能。目前,谷歌提出的分布式文件系统理论是业界流行的分布式文件系统的基础,谷歌文件系统(GFS)就是为了解决其海量数据的存储、搜索与分析等问题而研发的,其它如Hadoop分布式文件系统(HDFS)、Kosmos文件系统(KFs)是基于Goolgle分布式文件系统理论进行研发的开源系统。分布式并行计算框架是高效完成数据挖掘计算任务的关键。目前流行的一些分布式并行计算框架都对分布式计算的一些技术细节进行了封装,这样用户只需要考虑任务间的逻辑关系,而不用再过多的关注这些技术细节,不仅大大提高了研发的效率,而且还可以有效的降低系统维护的成本。典型的分布式并行计算框架如谷歌提出的Map Reduce并行计算框架、Pregel迭代处理计算框架等。目前业界开源的云计算平台Hadoop平台,包含HDFS和Map Reduce,为海量数据挖掘平台提供完备的云计算平台支撑平台。

3.2数据汇集调度技术。数据汇集调度技术需要实现的是对接入云计算平台的不同类型数据的汇集与调度。数据汇集与调度需要支持不同格式的源数据,还要提供多种数据同步方式。解决不同数据的规约问题是数据汇集调度技术的任务,技术解决方案需要考虑对网络上不同系统生成的数据格式的支持,如联机事务处理系统(0LTP)数据、联机分析处理系统(0LAP)数据、各种日志数据、爬虫数据等,如此才能实现数据的挖掘与分析。

3.3服务调度和服务管理技术。为了能够让不同的业务系统使用本计算平台,平台必须要提供服务调度和服务管理功能。服务调度根据服务的优先级以及服务和资源的匹配情况等进行调度,解决服务的并行互斥、隔离等,保证数据挖掘平台的云服务是安全、可靠的,并根据服务管控进行调度控制。服务管理实现统一的服务注册、服务暴露等功能,不仅支持本地服务能力的暴露,也支持第三方数据挖掘能力的接入,很好地扩展数据挖掘平台的服务能力。

3.4挖掘算法并行化技术。挖掘算法并行化是有效利用云计算平台提供的基础能力的关键技术之一,涉及到算法是否可以并行、以及并行策略的选择等技术。数据挖掘算法主要有决策树算法、关联规则算法以及K-平均值算法等,算法的并行化,是利用云计算平台进行数据挖掘的关键技术。

(作者单位:辽宁省本溪市卫生学校)

作者:冯波

第二篇:大数据云计算环境下的数据安全研究

摘 要:针对大数据云计算环境下的数据安全问题进行分析,突出表现在数据访问安全、数据隔离安全及数据销毁安全等方面。结合大数据云计算环境下的数据安全管理需求,提出针对性的管理与防范对策,以期能够优化数据管理的效果,降低数据安全问题的发生率。

关键词:大数据 云计算环境 数据安全

在网络信息技术快速发展的时代背景下,大数据云计算的方式逐渐融入人们的生活,对人们的生活方式与工作方式产生了较大影响,与此同时,数据安全问题也逐渐受到人们的广泛关注。大数据云计算在为人们带来诸多便利的同时,也增加了数据泄露、信息窃取等风险发生率,致使各类风险问题频繁发生。因此在大数据云计算环境下,需要提升对数据安全管理的重视程度,构建网络防护系统,降低网络侵袭发生率,保证数据的安全性。文章将结合当前大数据云计算环境下的数据安全进行分析,希望能够对相关研究活动带来一定借鉴价值。

1 大数据云计算环境下的数据安全问题分析

大数据云计算环境下的数据安全问题,突出表现在数据访问安全、数据隔离安全及数据销毁安全等方面。

1.1 数据访问安全

大数据云计算环境对数据资源的安全性产生了一定的影响,使得用户非法访问数据的问题频频发生[1]。数据安全受到内部与外部的双重威胁,比如用户可以通过云平台技术实现数据的保存,其为数据保存提供了更便利的条件。但云平台在接收数据、应用程序的过程中,在内部安全防护体系不够完善的情况下,比较易于受到“黑客”的攻击,进而造成用户数据泄露或丢失等问题的发生。在内部工作人员进行违规操作时,也会增加数据安全问题的发生率,因此需要加强安全防护管理力度。

1.2 数据隔离安全

站在数据安全的视角而言,数据共享期间风险系数较高,且风险承担的对象多为企业或者政府等,其数据资料较多,影响范围较大[2]。在面临数据隔离不当的情况下,易于出现丢失、窃取数据的风险,会对企业与政府的工作产生较大影响。

在数据化的环境下,不管是企业还是政府,其数据应用频率的提升,数据技术的应用范围的扩展,都使数据隔离安全管理显得尤为重要。在集体化的办公氛围中,数据共享的频率较高,且在数据资料较多的情况下,共享的时间较长。在未对数据实施加密处理的情况下,会影响其安全性,在数据共享或者数据传输的过程中易于发生数据窃取等不良情况。针对上述问题,需要予以“一对一”管理,构建数据隔离化模式,从而保证数据的安全。

1.3 数据销毁安全

在大数据云计算的环境下,数据处理难度较大。在数据获取、数据应用完成后,需要对其进行销毁,进而避免非法窃取问题的发生[3]。其在销毁不够全面的情况下,易被不法分子利用。

2 大數据云计算环境下的数据安全管理途径

在大数据云计算的环境下,可以通过健全网络防护系统,加强数据共享隔离及矩阵乱序数据加密等方式,保证数据的安全。

2.1 健全网络防护系统

在大数据云计算的环境下,可以通过构建云平台服务系统的方式,提升数据管理的效果及管理的安全性[4]。大数据云计算管理期间可以设置用户访问的权限,优化数据加密、解密技术,增加秘钥的安全系数,降低非法入侵发生率,这将对数据的安全产生重要影响。

在大数据云计算的环境下需要定期实施网络防护系统的安全性检查,早点发现漏洞并及时整改、修复漏洞,保证网络安全。工作人员需要严格按照数据安全管理的规定,认真开展数据操作活动。在虚拟化大数据云计算的平台中,根据信任模型在短时间内建立保护性VMM指令,进而最大限度降低外界因素对数据安全带来的不良影响。结合用户的实际需求选择IAA云服务类型,根据数据安全管理对操作系统模式实施动态调节,持续提升数据管理的安全性。

2.2 加强数据共享隔离

在大数据时代下,用户信息和数据需要通过网络计算的方式,传输于云端,其具有一定虚拟性。

为了避免在数据传输或数据共享期间受到安全问题的影响,需要在一对一传输的基础上,隔离第三方。并通过用户身份认证的方式,进一步加强用户对数据安全管理的重视,加强数据共享隔离,预防共享期间数据窃取的发生。

2.3 矩阵乱序数据加密

数据销毁是数据应用的最后环节,在终端未进行全面销毁的情况下,仍然具有数据泄露的风险。受到大数据云计算方式的影响,数据的类型及内容较多,数据销毁工作通常需要花费10多分钟的时间,这增加了销毁期间的数据泄露发生率。

数据销毁期间可以采用矩阵乱序数据加密的方式,保证其数据处理的安全性,各组元素的持续变化也能增强防护的整体效果。

3 结语

在大数据云计算的环境下,可以通过数据分析、数据隔离等方式,保证数据的安全性,构建完善的网络信息数据防护系统,进而保证数据安全和数据使用质量。

参考文献

[1] 王硕刚,巨维博,王一宁,等.浅谈大数据、云计算技术对高校学生管理信息化建设的影响[J].中国管理信息化,2018,21(3):211-213.

[2] 张新刚,于波,程新党,等.大数据与云计算环境下个人信息安全协同保护研究[J].电脑知识与技术,2016,12(3):53-55.

[3] 宋文超,王烨,黄勇,等.大数据环境下的云计算网络安全入侵检测模型仿真[J].中国西部科技,2015,14(8):86-88.

[4] 马小平,胡延军,缪燕子.物联网、大数据及云计算技术在煤矿安全生产中的应用研究[J].工矿自动化,2014,40(4):5-9.

作者:马瑞成

第三篇:基于大数据云计算网络环境的数据安全问题分析

摘 要:在日新月异的互联网经济发展大潮中,大数据云计算在其中担当着重要角色,在各行各业中用的如火如荼。但是,受某些客观因素的影响,很多企业用户在面对大数据以及云计算的大环境下屡屡遭遇到大数据安全泄露风险及其带来的巨大损失,使得我国互联网安全行业的很多技术员和研究员对此更加高度重视。如何有效规避数据安全风险成为人们重点关注与思考的问题。文章主要结合当前大数据行业云计算技术概况、重要性、分类、亮点,分析了当前大数据行业云计算应用环境下常见的4大数据安全技术问题,并分别提出4大重點解决对策方案。

关键词:大数据时代云计算;重大数据安全风险分析;数据虚拟自动化

0 引言

随着现代科学信息技术的快速进步发展,大数据时代云计算以及网络安全技术已经备受广大网络企业以及用户的广泛青睐。而数据安全问题所带来的损失引起广大用户的普遍重视,对如何提高计算机防护性能,进而有效保护数据安全成为重中之重。

1 大数据云计算的概况

大数据云计算实现了对大数据存储时间灵活性和空间灵活性。IaaS实现了对大数据云计算、网络、存储资源的弹性。而PaaS实现了大数据应用层面的弹性。在PaaS层中一个复杂的通用应用就是大数据平台。

云计算,可以为企业大数据提供数据处理资源的灵活性。而云计算也很有可能会部署大数据放到这个PaaS的大数据中心平台上,作为一个非常重要的一个企业之间通用的大数据平台应用。伴随科技的进步,大数据云计算应运而生[1]。

2 大数据云计算的重要性

大数据云整合计算系统是一种数据资源整合计算处理工具,是把十万多台计算机通过云虚拟化技术整合后生成一台具有强大数据计算处理能力的大型计算机管理系统,并把这强大的计算能力能够借助诸如SaaS,PaaS,IaaS等先进的数据服务管理模式进行分散投放到每个用户手中。只要将数据信息导入云平台,人工通过云服务就能启用云计算技术,从而对所有数据信息进行计算。这项基于大数据云移动计算核心技术不仅拥有强大的信息处理分析能力,较低的设计成本,而且拥有简单便捷的各种计算应用模式,让各行各业的用户省时、省力、省钱,更省心[2]。

3 大数据和云计算的关系类型

3.1 公共云中的IaaS

IaaS是一种简单经济高效的数据解决模式方案,利用此云计算服务、大数据的云服务架构使得人们同时能够具备访问无限的数据存储和使用计算机的能力。对于那些云服务提供商需要承担所有资源管理系统基础和软硬件开发费用的大型企业而言,这无疑是一种非常简单经济高效的企业解决模式方案。

3.2 私有云中的PaaS

PaaS就是供应商将各种大数据分析技术应用纳入其中所提供的相关服务。因此,它们满足了系统处理用于管理单个应用软件和单一硬件两个元素的数据复杂性的基本需求,而这对处理TB级别的数据时来说是一个真正的复杂问题[3]。

3.3 混合云中的SaaS

如今,移动社交化和网络媒体相关业务数据信息已逐渐发展成为网络创业者和公司技术人员前期进行社交媒体相关业务数据分析的一个重要基本参数。在这种情况下,SaaS上的软件供应商已经成功提供了一个用于客户进行数据分析的出色的大数据处理平台。

4 大数据云计算的亮点

4.1 数据动态化、虚拟化

云计算中的数据动态化,具有强大的伸缩修改性,用户以自身需求为基础,实施扩展。云计算采用虚拟化技术统一管理底层数据,利用底层架构实施抽象化,也可支持设备差异和兼容的透明化。

4.2 成本低、处理信息能力强

企业利用大数据云计算服务,租用自身需要的服务,降低运营成本,也无须参与管理,省去了人工计算,用户要获取相应的数据信息只需通过统一的应用程序登陆大数据云[4]。

4.3 资源覆盖广阔

根据利用云计算以及互联网技术实现网络资源共享的主要特点,用户完全可以自由使用计算机下载资源池中的所有硬件和相关软件。

4.4 灵活管理,简单便捷

大数据联合云计算将各大计算数据资源直接联合管理起来,由应用软件或人工进行管理,用户几乎可以随时随地直接登录这个大数据云计算平台,将自己需要的数据关键词在上面直接搜索出来即可快速获取得到相应的数据信息。

4.5 大数据云计算按需服务付费

用户选择云计算服务时可以按实际需求进行选择服务,计算费用。

5 大数据云计算存在的数据安全问题

5.1 数据监控与防护不及时

在大数据云计算环境中不能及时识别与防护不断更新的网络攻击手段,云平台遭遇黑客入侵,对大数据造成威胁。

5.2 数据访问安全隐患

在用户使用大数据云计算系统时将新的数据信息导入云平台实现数据访问的过程中,有一些黑客会攻击云平台,通过非法手段欺骗访问机制,随之进入数据库内部,大肆篡改、破坏、盗取内部数据等,使用户遭受损失。

5.3 数据残留引发的安全问题

在大数据云计算环境中没有防护措施,正是这些残留数据,使黑客等具有一定技术水平的不法分子通过相关技术手段,实现对残留数据的还原,进而盗取数据信息,造成信息泄露,或者根据网络漏洞,入侵计算机网络系统,导致其瘫痪。

5.4 云计算服务商对用户数据安全缺乏透明性

云计算安全服务商因为缺乏对于安全的整体控制和服务实施的透明性,许多云计算服务商因为在安全服务水平以及协议、提供商安全管理服务功能以及安全保护责任等多个领域上都缺乏整体透明度,从而严重阻碍了服务用户对于服务相关安全漏洞的正常运行以及风险的有效管理[5]。

6 解决方案

6.1 对大数据云计算中的部分重要信息自身主动存放,加强数据保护

计算机为该系统本身就可能有一些基本漏洞和很多缺陷。对我国大数据云计算系统中的部分重要數据信息自身主动采集存放,加强重要数据保护。可以考虑建立只需要面向内部企业用户的小型私有企业大数据云,是一种安全稳定的私有大数据云管理环境。

6.2 提高防护数据信息系统自我更新

在云计算数据信息识别功能基础上,所有被定义为未知数据信息的目标全部都被视作防护数据信息导入大数据中,并进入“知识库”(一种数据储存库,类似于以往安全防护软件的“病毒库”),这样面对未知数据信息,大数据云计算系统在下一次遇到相同信息后即可识别,说明该防护系统具有自我更新的作用。

6.3 加强相关的审计和监控措施,配置自动报警系统

当一个用户已经准备把这些数据信息提交给一个大数据云时,必须要把这个验证码提交给一个专业的第三方进行认证。而这个平台专业第三方可通过一套全面的性能评估检测体系,对整个大数据云平台中的软件服务器、软件系统配置、负荷运行管理等环节进行实时动态监控和安全性能测试,检测使用过程中一旦系统出现安全问题,则该系统将立即自动报警。

6.4 采用密码技术加强身份认证和访问控制

大数据云网络计算服务平台的网络数据共享,降低了用户数据的网络安全性,可结合云网络安全防护技术,采用网络密码安全技术支持。同时对全局用户访问身份信息管理技术创建一个统一的中国全局用户身份信息认证管理技术,实现统一用户访问身份管理,进一步增强大数据云的信息安全性。

那么,云计算系统需要如何建立一个身份认证系统,不断完善身份认证技术。利用数字证书认证,结合硬件信息绑定和生物特征识别,集中认证用户信息;或者对不同用户实施区域划分,集中授权云计算系统资源访问,对于关键用户可以利用细粒度授权的方式。在账号的管理过程中,撤销长期不用账号,使其退出检测,这样有效地保证了同一个账号在同一时间只能在一个设备上进行登录。

7 结语

随着我国经济的快速健康发展,科技不断进步,大数据以及云计算的发展前景可观。目前,许多大型企业无须用户就可以利用企业大数据以及云计算的技术优势迅速工作,节省大量人工的成本同时,提高了企业工作效率。但目前用户所非常担心的用户数据信息安全重大问题不容忽视,也不能将其尺度放大,避之不用,毕竟目前还有好多的研究员在对此项核心技术逐步进行优化,有效率地保障用户信息安全。

[参考文献]

[1]吴为强.云计算与大数据环境下全方位多角度信息安全技术研究与实践[J].通讯世界,2017(14):45-46.

[2]柏强,许译文,王应求.云计算环境下的数据安全应对策略研究[J].信息系统工程,2012(7):72-73.

[3]王晓蓉.大数据云计算环境下的数据安全分析[J].智能计算机与应用,2017(6):171-172.

[4]朱登发.大数据云计算环境下的数据安全及防范对策探讨[J].电脑知识与技术,2018(4):22-23.

[5]张艳艳.大数据云计算环境下的数据安全分析[J].中国管理信息化,2020(24):212-213.

(编辑 何 琳)

Analysis of data security problems based on Big Data cloud computing network

Li Yan

(Nanyang Vocational College of Agricultural, Nanyang 473000, China)

Key words:Big Data cloud computing; significant data security risk analysis; data virtual automation

作者:李燕

上一篇:计算题教学论文范文下一篇:工程经济学论文范文