it运维服务管理规范

2022-09-27

第一篇:it运维服务管理规范

IT运维管理咨询服务

什么是IT运维管理

IT运维管理,是指单位IT部门采用相关的方法、手段、技术、制度、流程和文档等,对IT 运行环境(如硬软件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理。

为什么要做IT运维管理

IT运维管理是时下IT界最热门的话题之一。随着IT建设的不断深入和完善,计算机硬软件系统的运行维护已经成为了各行各业各单位领导和信息服务部门普遍关注和不堪重负的问题。由于这是一个随着计算机信息技术的深入应用而产生的新课题,因此如何进行有效的IT运维管理,这方面的知识积累和应用技术还刚刚起步。对这一领域的研究和探索,将具有广阔的发展前景和巨大的 现实意义。

怎么实施IT运维管理

【明确组织目标】

一个组织必须有明确的既定的目标,任何管理系统都应有明确的目标,目标不确定,或者混淆了不同的目标,都必然会导致管理的混乱。任何管理活动都必须把制定目标作为首要任务。 【明确职责与分工】

 可以最大限度地实现劳动用工的科学配置;  有效地防止因职务重叠而发生的工作扯皮现象;  提高内部竞争活力,更好地发现和使用人才;  是组织考核的依据;

 提高工作效率和工作质量;  规范操作行为;

 减少违章行为和违章事故的发生。 【明确工作流程】

宏伟的战略和目标只有真正落实在流程上面,才是真正开始执行的战略。企业在做了总的战略部署之后还要做分领域的业务战略,然后细分到市场、研发、生产,一直分解到具体的活动。流程是落实战略执行的关键,流程就是执行力。 【明确考核机制】

从企业经营目标出发进行评价,并使评价和评价之后的人事待遇管理有助于企业经营目标的实现。运用一套系统的制度性规范、程序和方法进行评价。对组织成员在日常工作中体现出来的工作能力、工作态度和工作成绩,进行以事实为依据的评价。 【流程固化】

流程固化并不是简单的将流程图贴在墙上,告知员工就可以达到目的。很大一方面,需要管理的手段与合理的方式加以辅导,才能够使流程真正的落地和固化。“习惯是最顽固的敌人”积累多年的工作方式和习惯,会成为流程固化所要面对的第一道前菜,流程固化,是两只手,“硬件与软件”结合的新的工作方式形成的过程。

上海天帷IT运维管理

运维服务方面通过引入ITIL V3全生命周期管理的框架及服务理念,在开展运维服务的同时进行,以服务战略为核心,设计提供客户真正所需的服务产品,通过专业的服务支持计划、服务流程和服务支持资源,确保服务运营的稳定和可靠,同时不断改进和完善。

第二篇:知识管理提升IT运维服务管理能力

随着企业IT设备和信息系统的增多,IT运维服务管理显得越来越重要。如何提高IT运维成为企业越来越关注的话题。AMT研究报告表明,通过在IT运维服务管理中开展知识管理,将有助于实现IT运维服务目标。

IT运维服务管理中的知识主要包括:

1、IT服务相关的制度、流程

2、针对不同事件和问题的解决方案

3、IT服务管理过程中产生的变更申请、测试方案、技术方案等

4、技术参考资料,例如网络拓扑图等

根据知识是否与IT运维服务流程相关,可以把知识分为流程相关类知识和非流程相关类知识。解决方案是在事件管理流程和问题管理流程中产生的知识,测试方案和技术方案是在变更管理流程中产生的知识,它们都属于流程相关类知识。有效开展知识管理,实现知识的创建、储存、共享、应用,对IT运维服务管理的作用主要体现在:

提高运维响应速度和服务质量。质量、数量及知识结构都达到一定标准的知识库,作为IT运维的强大储备库,加之运维知识库工具具备方便、高效的搜索功能,无疑是 快速响应IT服务需求的捷径。而能够进入知识库的解决方案一般来说是最正确、标准和高效的。

减少转交率,降低运维成本。如果多数问题及其解决方案都可以从知识库中简单、方便获取,更多的事件将在一线技术人员解决,减少转交给二线、三线或四线技术人员的事件量。从而将IT支持人员从重复性的工作中解放出来,着手解决其他新的问题,从而达到提升工作效率,降低IT维护成本的目的。

避免知识流失。许多隐性知识集中在岗位工作人员的脑子里,一些IT应用的操作或故障解决方法可能起初只有开发人员知道,知识管理可以有效避免由人员流失造成的知识流失。

实现用户自助服务,提高用户满意度,降低运维成本。用户可以直接从知识库中查询解决方案并自己解决问题,将减少一线技术人员对事件和问题的处理量。

虽然开展知识管理对IT运维服务管理具有明显的上述作用,但在实际运行中会遇到很多的阻力:技术人员担心将自己的技术解决方案整理出来,供大家共享会降低他们的在团体中的价值,而不愿意共享知识;缺乏知识管理系统做支撑,而不方便共享知识等。

为了克服知识管理实施的阻力,促进知识价值最大化,从技术、流程、人员三个方面开展知识管理:

一、技术方面:建设IT运维服务系统,非结构化数据由内容管理平台统一管理

IT运维服务系统采用四层架构,分别为数据资源层、数据管理层、数据服务层和系统功能层。IT运维服务系统应满足SOA架构要求,以实现跨系统之间的数据交换。

在IT运维服务系统中,结构化数据由本系统数据库储存,非结构化数据(解决方案、技术方案、参考资料等知识)统一储存在公司内容管理平台中。内容管理为IT运维服务系统提供数据存储服务、内容查询服务等基础性服务。

IT运维服务系统中的非结构化数据统一储存在内容管理平台的优势为:

公司所有的非结构化数据统一储存在内容管理平台中,实现“唯一储存、多处引用”,减少数据冗余。

内容管理平台可以提供丰富的检索功能(包括属性检索、全文检索、组合检索等),方便知识的应用。

同时,IT运维服务相关的结构化数据和非结构化数据分别储存在IT运维系统和内容管理平台,需要IT运维系统与内容管理平台实现数据集成。IT运维系统可以提供Web service或JAVA API 与内容管理平台进行数据交换,非结构化数据在IT运维服务系统完成审核后直接检入到内容管理平台。

二、流程方面:在IT运维服务流程中自动收集和应用流程相关类知识

依据ILIL标准细化IT服务流程,为了实现流程相关类知识能在流程中自动收集,要求技术人员在处理事件时把事件与解决方案关联。具体要求如下:

每个事件只对应一个解决方案,但每个解决方案可以对应多个事件。

技术人员搜索知识库,如果知识库中已有解决方案,则无需重新创建解决方案,直接把解决方案与该事件关联即可;如果知识库中没有解决方案,则需要重新创建解决方案并在上传知识库,同时该解决方案与事件关联。

上传的解决方案必须经过技术负责人审核,主要进行内容审核(该解决方案的描述是否符合该事件)和形式审核(属性设置是否正确)。

一线技术人员关闭事件必须满足两个条件:经过对用户验证事件已解决和在系统中事件有对应的经过审核正确的解决方案。

一般而言,员工不会愿意在流程处理结束后再做总结,所以将知识收集结合在业务流程中,才能保证知识收集的数量与质量。同时,如果知识库中已存在类似的解决方案,采用事件与已有的解决方案直接关联的形式也避免了技术人员的重复工作。但是,对于非流程相关类知识将需要通过建立共享的文化促进知识的分享与应用。

三、人员方面

1、组织专门的技术人员从事解决方案研究

实施IT运维服务系统和流程优化后,技术人员可以直接参考知识库中的解决方案进行处理,所以对于一般技术人员的能力素质要求和数量要求就不用过高。但是这要求公司有丰富的解决方案可以利用。技术能力比较强的技术人员专门从事解决方案的研究工作,既提高了高素质技术人员的价值,又通过合理分工(有的技术人员专门做现场服务,有的做后台研究)提高了工作效率。

2、建立知识共享的企业文化,进行非流程相关类知识的收集

建立知识共享的企业文化需要克服员工不知道、不能够、不愿意共享知识的阻力。通过知识管理宣传等形式与员工共识知识管理愿景和转变需求,解决不知道的阻力,并建立紧迫感;通过知识管理培训等方式介绍知识管理系统功能解决不能够的阻力;通过领导推动和建立激励措施等方式解决员工不愿意的阻力。最终形成知识共享的文化,员工自觉分享与应用知识。

综上所述:通过技术、流程和人员三方面开展在IT运维服务管理中开展知识管理,将有效提高IT服务水平、降低服务成本、实现知识价值最大化。

第三篇:IT运维服务合同()[范文]

IT运维服务合同

甲方: 乙方: 鉴于:

甲方需要乙方为网络、硬件等信息化建设中所需的内容提供技术支持与维护服务,乙方愿意以本合同约定的条款和条件向甲方提供技术支持与维护服务,以满足甲方信息化网络正常运行的需要。甲、乙双方经平等协商一致,签订本合同。

第一条:基本原则

1.1本合同旨在明确乙方向甲方提供信息化建设中所需的技术支持与维护服务时,甲、乙双方必须遵守的基本原则,以及技术支持与维护服务的基本内容等事项。

1.2乙方所提供的技术支持与维护服务,符合国家相关部门有关技术质量的规定标准和甲方需求。甲方有权对乙方技术人员的工作态度、完成情况进行监督、签收,提出意见,以提高维护服务质量。

1.3乙方服务人员应严格遵守公司的各项规章制度,否则,甲方有权根据实际情况对乙方做出相应处罚。

1.4由于不可抗力或甲方及其他第三方的原因而给甲方设备造成的损失,乙方不承担责任。

1.5甲方委托第三方对设置在其网内的设备及软件进行调整、变更时,应及时通知乙方,以便乙方及时掌握网内设置及软件增减或变更情况,更好地为甲方提供服务。 1.6甲方需要从网内迁移其设备时,应提前通知乙方,以便于双方配合,甲、乙双方可就设备迁移具体事项另行协商。

1.7乙方有权在合同期内参加信息化建设系统建设中的随工、测试、验收等工作。

1.8甲、乙双方履行本合同的技术支持与维护服务时,双方之间应提供必要的便利条件,积极配合。

1.9指定联系人:甲方指定 为联系人,乙方指定 为联系人,全权负责日常服务合作事宜,双方指定联系人发生变化时,应在3个工作日内书面通知对方。

第二条:技术支持与维护服务的范围和约定 2.1 技术支持与维护服务的场所:

(场所填写)

2.2技术支持与维护服务的内容:乙方应根据的要求,提供相应的技术支持与服务,并应达到关于服务质量的要求,乙方应对其人员提供服务所引起的对用户的损害承担赔偿责任。具体的服务方式及范围如下:

(1) 网络技术支持与维护:„„

(2) 核心设备技术支持与维护:网络系统核心设备包括等,以上设备的技术支持、日常维护、故障处理、定期保养清洁、定时备份,保证设备的正常运行。

(3) 接入设备技术支持与维护:„„

(4) 终端设备:„„。以上设备的技术支持、日常维护、故障处理、病毒防治,保证设备的正常运行。 (5) 应急处理:双方协商确定多种应急处理方案,必要时进行应急预案演习,保证在出现意外情况时能够尽量减少或避免因为系统的故障而产生的不良影响(比如服务器故障、停电、通信线路故障、网络遭受病毒攻击等)。 2.3技术支持与维护服务方式

(1) 合同签订后,乙方派 名专职技术人员,进行网络系统的技术支持与维护。另派 名技术人员随时响应进行技术支持与维护。

(2) 快速上门:若甲方的设备、系统、网络在使用中发生故障,乙方应以电话和远程等方式支持提供解决方案,如无法解决,则在规定时间( X小时)内上门维修。 (3) 硬件维修:„„

(4) 技术咨询:乙方有义务根据要求提供电话热线服务、进行各种电脑操作指导,提出关于设备更新、软硬件升级等合理化建议。乙方具备提供后续技术支持与维修服务的能力。 2.4技术支持与服务标准

(1) 保证网络设备及系统运行正常。 (2) 服务时间:X小时/天*X天/周。

(3) 建立技术支持与维护服务登记制度:乙方对每一次电话咨询、故障申告等进行登记,并将处理过程和结果进行记录。对上门维护服务登记时,要有乙方的签字认可。

第三条:技术支持与维修服务费及支付方式

3.1根据甲方网络所用设备总价、服务场所的分布情况、技术支持与维修服务的人员配备,通过谈判:本合同技术支持与维护服务费总额为人民币: 元整。

3.2甲乙双方在本合同签订后,甲方向乙方支付本合同款。(支付方式) 3.3技术支持与维修服务中的低值易耗物品、所需工具、笔记本电脑、通讯工具、仪表、车辆、交通费等由甲方负责;

第四条:权利义务的转让

4.1任何一方未经过对方的书面同意,不得转让本合同项下的任何一项权利和义务。

4.2 甲方和乙方应将谈判文件、商务文件、技术文件作为合同基础。 第五条:保密

5.1 乙方有责任对甲方提供的相应文档、技术资料、安装介质进行妥善保管,并保证遵守相应的保密协议,避免用户机密的泄露,如有因乙方技术人员失误或故意行为导致的用户机密泄露,乙方要承担相应的赔偿责任。

5.2除了按照甲方要求完成指派的服务工作,乙方无权代表或以甲方的名义从事任何商业活动,本协议不在双方之间产生任何代理、合资、从属关系,任何一方在未得到对方的实际书面许可之前,不得使用对方的名称、商标、商号、标识等任何知识产权。

第六条:违约责任

6.1 任何一方未履行本合同项下的任何一项条款均被视为违约。任何一方在收到对方的具体说明违约情况的书面通知后,如确认违约行为实际存在,则应在20日内对违约行为予以纠正并书面通知对方;如认为违约行为不存在,则应在20日内向对方提出书面异议或说明。在此情形下,甲、乙双方可就此问题进行协商,协商不成的,按本合同争议条款解决,违约方应承担因自己的违约行为造成的直接经济损失。

6.2 甲方有权定期或不定期检查维护质量,对乙方未达要求的,核减相应的维护费用。

第七条:免责条款

7.1 因不可抗力导致甲乙双方或一方不能履行本合同项下有关义务时,甲、乙双方相互不承担违约责任。但遇有不可抗力的一方或双方应于不可抗力发生后10日内将情况告知对方,并提供相关证明。在不可抗力影响消除后的合理时间内,一方或双方应当继续履行合同。

第八条:技术支持与维护服务期限

8.1 自 年 月 日起,至 年 月 日止。本合同自签订之日起生效。

第九条:通知

9.1 依照本合同要求任何一方发出的通知或其它联系应以中文书写,通知可以专人递交,或以挂号信件、或以公认的快递服务或图文传真发送到另一方。通知视为有效送达的日期应按下述方法确定:

(1)专人递交的通知在专人递交之日视为送达;

(2)以挂号信件发出的通知应在寄出日(以邮戳为凭)后第十日视为已送达;

(3)以图文传真发送的通知在成功传送和接受日后的第一个工作日视为已送达。

第十条:争议的解决

10.1 对于本合同履行而发生的争议,双方协商解决或提交当地人民法院裁决。

第十一条:附则

11.1 未经双方书面确认,任何一方不得变更或修改本合同。

12.2对于本合同未尽事宜,双方可随时签订补充协议或以附件的形式对本合同中的有关问题作出补充、说明、解释。本合同的补充协议和附件为其不可分的部分,与本合同具有同等法律效力。

12.3 本合同须加盖“骑缝章”,以确保合同的完整。

12.4 本合同共 页一式两份,双方各执一份,甲、乙双方法定代表人或授权代表签字并加盖公章后,方可生效,均具有同等法律效力。

甲方代表签字: 乙方代表签字:

盖章: 盖章:

日期: 日期:

第四篇:It运维服务工作总结

至2010年10月底,0000000000000000000有限公司在0000000000000000公司的运维又届满一年的时间了。在这为期一年的运维工作当中,xxxx的业务飞速发展,设备数量不断增加,人员的技术水平和业务知识有了显著的提升。我们的队伍在技术水平和管理经验上也有了本质的提高。

一、 细致缜密的完成计划中的日常运维工作: 严把质量;服务至上;严格要求;技术领先。

1. 承接运维工作初始信息技术部的各位领导就对我们的运维工作给予厚望,并提出了认真完善服务水平的方针。我们在服务过程中严格按照这一要求,以对保障xxxx的发展,对用户负责的精神,把“严把质量,服务至上”的原则贯穿于日常工作的各个环节之中。使本运维期过程中的客户满意度有了非常显著的提高,多次获得了用户的认可。

2. 对于在工作中信息技术部提出的新要求、新方案,我们及时相应配合,本着“严格要求”的原则,对于提出的要求科学性的分析研究,及时提出完整周密的解决方案,并拟请用户试行或测试后实施。有力的保障了运维工作的及时有效性。

3. 对于提高服务业务技术水平上,按照信息技术部的统一规划,按时完成一系列的既定培训计划。按照“技术领先”的原则,通过技术上的培训提高了业务水平和解决故障的效率;通过制定有效的安全机制和培训,健全了xxxx信息外包人员安全机制;通过保密制度的培训使运维人员能够树立自觉维护xxxx的信息安全防范意识;通过客户服务意识的培训提高了客户的满意度。

二、 吸收先进经验,保质保量的完成运维的各项任务: 运维期内主机、服务器、网络和桌面均没有发生严重的生产安全事故,对于一些潜在的威胁也都在得到信息技术部门的批示下,审慎周密的完成了整改工作。运用先进的技术和经验提高劳动效率和运维工作质量:

1.运用先进的运维工具提高劳动效率。通过监控软件随时保持信息的及时性、可控性,一旦发生问题可以迅速定位和修复。

2.经过信息技术部指导,我们在运维工作中大量了采用WEB2.0技术。使我们在高效完成运维工作的情况下,为xxxx节约了大量的费用投入。

3.在工作的过程中注意新技术和新方法的学习和收集,对于有利于运维工作的成功方案及时整理并提交信息技术部。经过5年来的维护工作存储了大量的知识库信息。

三、 适应任务需要,及时解决运维过程中的遇到的问题: 1. 在运维过程中遇到突发问题及时与信息技术部门相关人员进行沟通,对于紧急情况的处理按照《应急预案》进行对应处理。在节假日安排主要人员进行值班和备勤,保障24小时均能及时相应。 2. 在运维工作过程中,积极协助新增设备的各项实施工作,获得了信息技术部的肯定;在到货、验收、集成方案和安装调试过程中提供全程保障;对于数据的迁移、备份,各人按照自己的职责,在制定详尽的计划后、经过信息技术部的批准严格按照方案实施;

3. 在配合一些公司的重大活动、事件时,为应对信息技术部人员不足的情况。我们一方面做好运维工作的情况下,另一方面派出部分或全部人员协助信息技术部的各项工作,以弥补其人力不足的状况;

4. 对于机房的升级改造过程中积极配合,全程派员监理施工过程,及时出具各种施工方案和设计资料。施工完成后及时完善各类图表的变更、标识。

5. 配合行政部门做好资产管理工作,对于资产管理系统派出专门人员参与学习,并对备份、升级方案及时提出自己的建议;对于办公室提出的节能减排的倡议积极响应,主动采取措施避免能源和材料的浪费;多次配合办公室进行资产统计、巡检、登记工作。

四、 认真完成运维工作中的汇报、总结和知识积累工作: 1. 《知识库》通过连续2年的整理已经形成了成体系的完整运维知识全集,方便了各类人员通过权限管理可以随时查找所需的运维信息,为提高运维工作效率提供了基础保障。

2. 日常报告:共提交《运维日报》309份、《运维周报》52份、《机房温度周报》52份、《运维月报》12份、《运维半年报》一份、《运维年报》一份、《桌面工作记录单》1914份、《磁带存取记录表》12份;

3. 工作报告:《变更报告》70份、《故障报告》5份、《数据安全保密措施报告》、《节日值班表》2份、《加班表》1份。另:《磁盘空间使用报告》等不定期报告;

4. 图表:《电路电源拓扑图》、《机房及机架布局图》、《网络拓扑图》、《san环境拓扑图》、《电话配线架对应图》、《ip及工位、电话统计图》、《外包人员信息系统登记表》等。

5. 其他报告:《外包人员信息安全管理建议》、《文件服务器使用管理建议》等。

通过以上的工作和措施,我公司顺利的完成了本期xxxx的运维工作任务,从根本上满足了设备运维的各项要求。任务的圆满完成,有赖于信息技术部正确的领导和大力协助;仰仗于xxxx健康发展的大好形势;得益于双方长期形成的信任与默契。

一年的时间很快过去了,在此向各位领导申请续约新的一年的运维合约。并且,在新的维护其中间维持上一年的全部合同条款,维持原来的运维价格不变。在新的运维期内,我们将保持冷静的头脑,继续发扬自身优势,多方弥补存在的不足,提高服务的水平和层次,在信息部的指导下,与各部门的同仁团结协作,大力配合,携手共进,高标准高质量完成各项运维任务。希望在新的运维期内能够更好的配合信息技术部的工作完成xxxx的各项要求和任务。

望各位领导批准。

00000000000000000000公司 xxxxxxxxxxxxxxx运维项目组

刘杨-luya@sohu.com

2010.9.30

第五篇:IT运维服务外包参考资料[模版]

选择IT运维服务外包优势

现如今,企业为了更好的节省开支,维持业务运营,纷纷选择IT运维服务外包作为运维手段。IT运维到底应不应该外包?如何选择外包合作伙伴?又该如何管理外包、并与外包公司长久相处?这三大问题长久以来一直困扰国内中小企业用户,让他们在 IT运维外包之路上徘徊不前。

在竞争日益激烈的今天,企业发展将越来越取决于核心业务的成败,将非核心业务外包给最擅长的专业公司去做,已经成为全球企业重要的战略思想和经营模式。

国外知名资讯机构的调查表明,全球90%的公司中至少有一项主要IT业务职能已选择IT运维服务外包,IT运维外包服务在国外很多国家得到了充分肯定和广泛的应用。2005年,全球运维外包服务市场整体规模已达到726.37亿美元,市场增长率为9.5%。外资企业用户市场需求的不断发展和本土用户行业需求的不断深入,催生了中国运维外包服务市场的进一步发展。据统计,中国运维外包服务市场规模2005年达到38.69亿元,同比增长了20.2%。近两年来,中国IT运维外包服务市场仍将保持快速发展趋势。

在这一大趋势下,众多借助外包,甩掉各种包袱与非核心业务的现代“轻公司”脱颖而出。这些公司机构简单,规模不大,运行灵活,但可调动和控制的资源丰富,并能创造高额利润,非常适应现在竞争中要求灵活多变、创新进取的潮流,其秘密武器就是引入了多种灵活的IT外包。

IT与外包,本是一对孪生兄弟。软件工程、项目开发、基础网络、呼叫中心等IT外包业务由来已久,在国内外都应用广泛。但是对于“IT运维外包”,跨国公司和国内中小型企业的态度却大相径庭。

国内众多中小企业CIO对于选择IT运维服务外包大多心存好感,但又有多重顾虑。首先是饭碗之忧,选择外包,IT部门和CIO会不会面临无事可做进而失业的危险?其次是质量之忧,万一效果不好,会不会造成花钱费力办坏事的结局?还有成本、管理、绩效等大大小小的问题,以及难以量化描述的“客户满意度”,让很多国内用户对于IT运维外包有心无胆,最终选择在IT项目上线后自行维护的方式。

与国内企业相比,欧美跨国公司CIO却不约而同都引入了IT运维外包。客齐集市场总监李佳的话很有代表性:“选不选择外包,不是CIO的个人喜好问题,而是企业要在有限的资源条件下实现利润最大化的必然选择。为了控制人力成本、保证IT的质量、时间和应用效果,选择外包是必然的。因为外包服务商的成本优势和专业优势是显而易见的。”

特灵空调IT总监汤国忠认为国内企业对于IT运维外包会影响“饭碗”的想法太过保守,而这种保守的想法倒可能真正会让CIO失去饭碗。他认为:“在系统上线后,CIO带领IT部门陷入琐碎的日常运维工作中,其重要性也就会越来越低,产生出会被‘替代掉’的危机感。假设,CIO选择IT运维服务外包,借助专业服务,一方面可以提高内部用户对于IT支持的满意度,另一方面能让自己有时间、有精力去做更有价值、更重要的事情,才会使IT部门在企业中的地位越来越重要!”

如何做好IT项目的运维管理?

所谓 IT项目运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 运行环境(如硬软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理。普通企事业单位的IT运维管理,存在着重操作、轻理论,重结果、轻总结的实际情况。根据相关统计,在日常的IT运维中。大约70%以上的故障是由业务人员首先发现的,而IT运维人员更多是担任救火队员的角色,表明了运维工作存在着大量的监测盲点,IT运维的工作处于相对被动的状态。这种传统的“见招拆招”式的IT运维管理方式已经不能满足企事业单位内部日趋扩大的信息化应用,而且在一定程度上也制约和影响了业务的开展。

IT管理和运维工作涵盖了各行业的各岗位中,如何提高工作效率,规避风险,更好的做好IT管理和运维工作,已经成为一个不断探索和研究的新兴课题。笔者认为,应从两个层面加强和完善IT管理和运维工作,可以改善IT运维工作的现状。

一、内部层面

1、转变IT运维管理工作方式和理念。强调从技术型向管理型转变。各企事业单位的应用系统和网络系统已经成支撑业务正常运转的重要基础,保证应用系统和网络系统的正常运行和使用成为了IT运维工作的重中之重。IT运维部门的职能应当从传统的重服务轻管理,逐步转变为服务与管理并行,规范化与人性化相辅相成的模式,以适应现代化信息的工作模式。

2、建立完善的内部信息共享平台。从基础设施。应用系统和业务服务三个方面打造完善的信息共享和资源监控平台。能建立有效的信息资源库,减低对关键技术人员的依赖,为日常IT运维和管理工作提供有效的保障:基础设施管理方面,对网络,应用系统软、硬件等资源进行细化管理,详细记录电子设备的出入库、维保、报废等环节。保证资源的有效利用;应用系统管理方面,对于各类应用系统的备份,日常维护进行有效管理控制,保证所有应用系统数据的一致性、准确性、及时性、可用性和完整性,并根据实际需要不断进行改进、完善或更新;业务服务管理方面,尽可能的记录所有的事件要素,包括问题描述、解决方案、操作人员等等。使得部门对人员的考核有了量化的标准,同时这个过程也有助于知识积累,形成有效的知识库,可以极大地减少对关键人员的依赖,降低人员流失的风险。

3、清理、简化现有IT运维管理制度。形成适合企事业单位管理实际的制度体系。以建立完整、规范、有效的内部规章制度体系为目标,紧密联系工作实际,按照适用、可行、合法、有效的原则,对现有规章制度进行全面的自查和清理。按照IT运维管理工作的职能分工分层次、分步骤地对制订的各项内部管理制度规程进行分类清理,从制度内容的适用性、可行性、依据和效力的合法性、执行的有效性等方面进行了逐条审核,并结合实际工作,对上级部门制订的内部管理制度与当前实际工作不符的情况进行修订和完善。逐步摈弃传统的“人管人”的工作模式,形成以制度带动人,以制度带动工作的长效机制。

4、建立例行巡查和通报制度。IT运维部门的负责人和业务主管可通过内部信息共享这一平台,对业务进行有效的监督。一是定期对记录的相关事项进行巡查,审计已登记发生事项的规范性。二是对正在发生的事件实时跟踪,及时了解事件的进展状况。规范各个流程的操作,从源头避免业务差错的发生。三是建立采集问题,核实整改问题及问题通报三个环节的通报机制,以提升力IT运维管理的效率。

二 、外部层面

1、加强与内部审计部门的业务合作。内部控制审计对组织治理、风险管理、改善控制效率和效果等方面有很大的促进作用。IT运维部门可配合内部审计部门进行运维管理,将内部控制审计作为常态化审计类型,通过这种方式,突出内控特点,运用规范的审计方法和评价体系,注重从控制、风险、管理等宏观层面查找问题、提出建议,以达到促进IT运维管理工作,完善内控和加强管理的目的。

2、通过内部审计部门,加强督导、整改等工作的实效。在IT运维管理工作的过程中,不仅要发现问题解决问题,更重要的是要形成完善的IT运维管理工作规范和流程,在这点上。可以通过内部审计部门对企事业单位内部进一步规范制度、程序和方法,形成对风险进行事前防范、事中控制、事后监督和纠正的动态过程和机制,强化重要业务环节的风险控制。加大检查力度,切实有效地推进督导、整改工作,建立内控管理的长效机制。

3、加强与内部审计部门的沟通交流和人员培训,培养复合型管理人员。定期组织IT运维人员和内部审计人员进行学习交流,探讨内控管理中存在的问题,交流内控管理的心得体会,充分发挥IT运维的技术优势和内控的管理优势,通过良好的内部沟通机制和完善的信息共享平台,建立内部控制体系运行网络和内部控制管理组织体系

专业IT运维助力企业IT实现价值

随着业务的不断扩展及IT的深化融合,IT运维在企业日常管理中的地位已经显得越发重要。然而,日常的运维工作繁琐、辛苦,还得不到认可。“吃力不讨好!”也成为很多兢兢业业的IT管理人员普遍存在的苦恼。

据统计,IT运维服务占到IT部门工作量的80%左右,其中包括人员、维护和故障修复的成本。而有关技术和基础产品的成本大约仅为20%左右,这一明显不平衡的比例,给不少企业IT部门带来巨大压力,束缚手脚,占用太多精力和时间。

转变观念 根本解放IT运维

IT运维,归根到底是一项服务性的工作,保证企业中的IT业务的稳步运行。但由于服务被认为产生的附加值偏低,被置于IT价值链的最末端,所以导致人们传统观念上的偏颇,从而企业导致对于服务的重视不足。而广大得不到话语权的CIO及IT管理人员只能被限制在日常的运维服务中,疲于奔命。

然而随着市场的发展,对于IT运维或IT服务的理解也在逐渐发生改变。如今仅仅是“卖产品”已经不能达到利益最大化的目的,越来越多的企业开始追求产品附加值,其中服务的价值也在慢慢开始受到重视。

而且随着信息化发展,企业日常业务也越来越离不开IT管理的支持,IT的及时性、稳定性和高效等特点,甚至影响到企业内外部的流程。由此可见,IT运维已经成为企业业务是否顺畅、高效的关键,所以企业解放IT运维已经是无法避免。

技术不断革新 IT运维不仅仅是工具

云计算、大数据等全新概念及技术不断涌现,让人们应接不暇的同时,人们是否会想到IT运维的创新呢?首先肯定是技术层面上的,在云的概念的引入,使得IT运维或服务的平台化成为可能,利用云及虚拟化技术,将服务放置在云端,从“工具”转换为“平台”,使得效率和成本都能得到大幅的提升。

同时,数据中心的飞速发展,也为企业提供了远程IT运维的可能,将数据、信息都放置在第三方数据中心中,由第三方专业服务团队托管,不仅降低企业自身的IT运维成本,也带来了更便利、快捷的服务。另一方面,数据中心在运维方面如何做到统

一、融合、高效的管理,也是提出了新的要求。

服务革新 创新实现企业IT新价值

虽然IT运维需要沉下去、把控细节,但广大CIO、IT管理人员仍然不能一味埋头做事,而是需要不断寻求新的方法。目前很多企业IT运维还存在不少误区或盲点,如重建设而轻运维,忽视流程细节的优化、缺乏整体规划等,都会对日常运维带来不少的问题。

近些年来,全覆盖式的咨询式第三方外包服务开始兴起。可以帮助企业从繁杂的事物性工作中解放出来,专心于业务及IT系统的建设。而且由于此类IT服务商专攻咨询及IT服务方面,相对更为专业,能够有的放矢的针对实际情况制定优化及改善的方案,提供最佳的改善策略。双方通过签订服务水平协议,可以有效的简化管理、并提升业绩。

从项目开始之初,IT服务商就根据企业的需求开展调研,从而有针对性的进行规划,预估未来的发展,事先就将问题杜绝。在实施期间,双方在密切保持沟通,不断优化、完善。在完成建设后,进一步建立全面的运维体系和机制,将运维的重要程度进行等级划分,形成差异化管理,保证稳定、安全。在长期的运维中的定期进行汇报及总结也是必不可少措施。

此外,IT运维也需要灵活定制,面向不同行业、不同规模的客户,提高灵活、可定制的服务,也是保证服务稳定实施的有力保证。

如今,由“成本中心”转化为“价值中心”已经成为企业发展的最终目标。然而面对如今这个产品微利的时代,服务所带来的高附加值,让追寻新突破的企业看到了发展的空间。但是,这一价值增长点也是不那么轻松,坚持以企业需求为导向,为企业创造长期的价值,才是IT运维的核心理念。

如何建立规范的IT运维管理制度

如何在有限的投入下尽快建立高效、规范的运维体系,提高IT管理水平,改善系统的运维质量,已经成为当前CIO面临的重要问题。尤其是如今很多企业把IT专项资金投入在着重解决从无到有的基础设施和系统的构建,然而却忽视了系统建设完成以后的运行维护;随之而来的是,信息化的运维压力和挑战逐渐凸现出来,已经成为影响信息系统应用效果的主要瓶颈。当系统进入运维期后,IT部门就像救火队一样,不知道什么时候、什么地方会出现“火”情。虽然作为CIO,一些具体的事情不需要CIO本人去做,比如系统参数的调整,订单的排程等,但是IT运维管理、系统运行维护、项目管理等工作他还是要一一过问。

IT运维被动救火,技术人员饱受抱怨

传统被动的、孤立的、分散的“救火队”式IT运维管理模式,让IT部门疲惫不堪。而且,随着公司业务模式的复杂化和多样化,更带来IT运营环境的复杂性和不确定性。在IT运维系统时,IT部门普遍面临多种问题。主要有以下几个方面: (1)运维人员被动救火,工作效率低下

在IT运维管理过程中, IT员工工作太被动,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”不但使IT服务人员终日忙碌,也使IT服务本身质量很难提高,导致IT和业务部门的满意度都不高等。

其中比较典型的例如IT部门响应服务需求时没有相应的时间记录工具,或者因为各种原因导致工作人员不愿使用工具记录工作情况,这样不仅不利于知识的积累和知识库的完善,更不利于处理过程的跟踪。

(2)流程规范不足,没有形成闭环跟踪

在运维流程方面,IT部门一直处于原始的状态。例如在事件处理流程上,存在以下几种典型的问题:①没有明确的事件升级标准,例如满足怎样的条件后,事件必须从一线转到二线支持工程师,再转到三线研发工程师处理。②没有事件的有限级定义标准,没有建立优先级和解决时限的关联关系,从而不能保证事件解决的实效性和 IT 资源的有效利用。③事件产生后没有明确而唯一的责任人,从而缺乏有效对事件监控和跟踪机制。④没有统一的 IT 服务管理对事件受理的界面,没有事件完整记录、没有及时反馈。

这些都使事件/服务请求处理过程中没有形成严格的闭环管理;没有建立明确的重大或紧急事件处理流程,从而不能保证在相应事件发生后有效及时地处理。对事件处理过程的记录比较分散,随意性很大,没有控制。更没有严格规范的流程政策和控制手段,使之存在太多的漏洞。整体运行维护情况无法一目了然,不能够清楚地知道各位员工的工作情况和工作状态,从而缺少对流程有效的监控和跟踪。 (3)缺乏运维技术工具

企业缺乏诸如事件监控和诊断工具等技术工具,事件不能在技术工具的支持下得到主动、快速处理。事件和工作任务在分派过程中没有相应的技术工具记录所有历史信息,不便于跟踪和分析;配置管理信息没有相关工具支持,以便为配置元素建立复杂的关系、状态等属性和提供相应查询功能。

总的来说,目前诸多企业在IT系统运维方面并没有高度重视,前期规划仅为解决短期IT建设问题。但随着企业规模的不断扩大,IT系统涉及的设备种类越来越多,对全系统的运营和维护管理提出了近乎苛刻的要求,而相对的则是IT运维的原始和落后的手段。

建立IT运维管理制度,关键在于规范 我们可以看出,在企业信息化发展到一定阶段,建设重点应该要从系统实施转向以应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除了技术的保障以外,制度保障越显得重要。

作为CIO,应首先是一位管理专家,其次才是技术专家。由此,建立完善的IT运维管理制度是最主要的工作内容,是企业信息化有效执行和监督的立足点。IT部门本身管理不好,就不可能为业务部门提供满意的IT服务,业务部门对IT部门的满意度就会低,满意度低又会影响IT投资及新项目的开展,使IT部门陷入困境。所以建立高效规范的IT运维管理机制,是CIO走向战略管理的第一步。对于IT部门来说,可从以下几个方面来进行IT运维制度化。 (1)转变运维观念,树立规范化意识

树立只有建立制度化的IT运维意识,才能在日常繁杂琐碎的工作中有效的区分任务的优先级,将有限的资源投入到最能满足“客户”需要的工作中。

天下大事必作于细。那么,如何保证运维工作的“无微不至”呢?方法是把运维工作和制度化紧紧地捆绑到一起。没有规矩,不成方圆,运维工作很琐碎,关键在于规范而不是创新。只有各级运维技术人员一丝不苟、老老实实按规范做,才能够把事情做好。 (2)建立事件处理流程,强化规范执行力度

首先需要建立故障和事件处理流程,利用表格工具等记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。建立每种事件的规范化处理指南,减少运维操作的随意性,在很大程度上降低故障发生的概率。

同时,建立IT运维管理制度非常重要,但是有了制度还要有人去执行,要强化执行制度比建立制度更重要的观念和意识。因此,对于IT部门来说,即使由于人力、财力非常有限,难以系统建设ITIL流程,但是制度化的ITIL运维思想的引入仍然是必要的。 (3)设立ITIL服务台,引入优先处理原则

设立服务台以确定服务要求和IT运维目标,ITIL指南要求企业定义服务台的关键流程,不仅仅定义流程是什么,还包括它们是如何运作的,还要指出每个流程对企业有什么影响和意义。当应用ITIL中的IT服务台及服务级别协议思想,例行的事就有人处理了;有了服务级别协议,制定事件处理优先级次序,就可把事件再细分为例行事件和例外事件。

(4)最后要引入SLA管理

SLA(Service Level Agreement即服务水平协议),IT部门应该自发给自己负责管理的系统或者客户服务建立一个能够量化的运维目标,这样不仅能够务实地提高服务质量和管理水平,也能够在目标达成后作为团队工作改进的成绩得到肯定,提高IT人员的工作成就感。

IT管理运维制度化难以逾越的两大难题 在信息化的建设中,制度建设是一道必要的保障。信息化不能一蹴而就,一化就灵,信息化不是万能的,还要靠制度去保障、去规范使用者的操作行为。换一句话说,只有用严格的制度去约束人的行为,才能杜绝随意性。

但从IT运维管理制度实际情况看,IT运维制度化在企业中并不受高度重视,面临着很多问题。IT运维管理制度的不完善,造成企业信息化发展不均衡和高失败率高,也是企业信息化不能深入开展的重要原因之一。目前企业在IT运维制度化存在难以逾越的两大难题: (1)运维制度不完整、缺乏规范

从总体上看,目前企业信息化管理制度内容,侧重硬件和网络方面的制度管理,而缺乏对软件、IT流程管理、IT资源的内容管理,IT运维管理制度不能科学全面的覆盖各项信息管理工作,从而容易造成信息管理上的漏洞。

(2)IT运维管理制度流于形式,缺乏必要的约束力

由于IT运维管理制度体系不健全,IT运维制度多数成为企业项目建设档案保存或作为应付对企业相关检查的材料,IT运维管理制度只是形式。另一方面,对于违反制度的行为和相关人员没有直接处罚和约束,也影响到IT运维制度工作的权威性,从而制约着IT运维工作的深入开展。

参照ITIL建立成功运维系统的三要素 从IT运维的现状和发展趋势来看,ITIL(信息技术基础设施库)已经成为推进IT运维体系建设和日常操作管理的首要标准和“最佳实践”参照。ITIL是起源于英国政府自身IT管理需求开发的标准。对照ITIL的九层评估模型,可以发现许多企业目前在人员、流程、技术等三个方面存在很多问题。也就是说,在进行IT运维管理时,要在这三个方面齐头并进才能从总体上提升IT运维服务管理。 (1)人员组织

在IT运维中人员因素应该是首要考虑的因素。因为ITIL的应用实际上是一个管理活动,特别依靠人的积极参与来完成。在管理过程中,可能涉及到人员的职能、利益、思维模式、工作方式等的转换,产生的误解、消极和阻力不容忽视。因此,除了在制度安排、企业文化方面的工作以外,更要积极采取多方面措施诱导和疏通,包括服务意识培训、ITIL运维技能培养、发展规划和激励等方式。 (2)管理流程

运维流程设计是ITIL实施核心之一,它必须结合现状,既不是现有管理流程的直接转述和电子化,也不是完全依照最佳实践的照搬拷贝。①流程是分阶段的目标定义、设计、固化、评价和改进过程。②ITIL作为IT部门内部管理的流程,存在和外部流程的接口整合衔接的问题,需要在运维流程设计和流程自动化处理等环节中妥善解决。另外,还应该充分了解:运维流程既有需要严格执行的僵化一面,也有面向效果灵活变通的一面。 (3)技术工具 管理工具是指在IT运维管理过程中能够借助的用来提高服务质量和效率的所有工具的总称。对于企业来说,要特别关注两类工具:①IT运维监控和诊断优化工具;②流程自动化工具。这里需要提醒的地方是,许多企业特别重视IT运维工具本身,而常常忽视了ITIL所倡导的通过流程等制度约束和引导,才能更好的发挥效益。因此,即使即使没有引入ITIL运维流程以及电子化平台,也应该利用建立一些必要的运维纸质流程和制度,否则难以得到很好的应用。

总之,想在IT系统运维过程获得最佳的效果,不是简单的单纯通过项目建设能够达到的,高效IT运维系统是需要一个持续改进、不断优化的长期过程,IT运维管理制度化也必不可少。

IT运维管理:“真”价值究竟在哪里?

在努力提升IT管理服务水平的同时,一个更深层次的讨论正在展开IT运维管理的真价值究竟在哪里?对于这一问题的回答,不仅关系到CIO和IT部门的话语权,更决定了现代信息化商业社会中,企业的发展与未来。

企业IT管理部门的宗旨是为组织的内部和外部提供优质高效的IT服务,而IT运维管理就是如何做到降价成本、提高效率,在满足企业IT服务需求的同时,提升IT运维水平,将IT部门由成本中心向价值中心转变这是很多IT管理者在描述IT运维工作目标时候的经典语录。但在表面的光环背后,IT运维管理部门在不少领导的心目中,却往往只是一个会花钱、说空话的部门。

虽然不断升级的云计算、应用交付、虚拟化等新技术浪潮,让IT运维管理需求成为炙手可热的话题。但相关的问题也随之而来,由于业务对IT系统依赖性不断增强,新的信息系统不断上线,IT人员不断增加,信息系统的运营费用也随之增加,在公司总运营成本中所占比重越来越大。在一些不太了解IT运维具体工作的领导眼中,如果每年的IT运维管理成本预算不断增加,而他又不清楚这些钱花到哪里去了,再加上时不时还会出现的IT故障和业务部门的投诉等等。这些问题积攒在一起, IT部门花钱惹麻烦的印象就顺理成章地形成了。

对于企业IT运维管理表面上被认可,但实际上体现不出真价值的普遍现象,锐捷网络IT运维管理业务部总经理冯晋阳认为:IT运维要显示出‘真’价值,不但要在底层设备完成监视与预警,还要在呈现上做文章。在当前经济形势下,任何一家企业都会注重成本管理,特别是其他费用大多都可精确衡量之后,IT运维成本价值模糊的问题就显得尤其突出。由于IT运维工作无法抛弃为业务部门服务的本质,也就决定了它缺乏张扬和展示手段,IT在企业中价值就有可能被冲淡。再加上业务系统时常遭受到IT系统的烦扰,无法提升管理效率,产生这样或者那样的投诉。所以,IT运维部门想要得到认可,就需要找到一个让别人发现自己价值的方法,这对于改变IT运维部门的尴尬局面将起到至关重要的作用。

传 统看、说、做 抹杀IT运维价值

面对这一问题,冯晋阳先生表示,实际上,传统的IT运维管理产品经过多年发展,虽然已经有了扎实的应用基础,但在体现IT系统真价值方面却还存在缺陷。

首先是看:假设企业的IT系统能够保持一个高效稳定的运行状况,不仅可以提升企业应对市场的能力,还可以降低企业的IT投入,最大限度地实现IT投资回报,这些都是IT运维管理的价值。那么,这个价值如何让领导层看到呢?是让领导亲临网管的桌子上,看看现在的网络流量有多么正常吗?想要知道答案,先拷问一下自己,如果你是一个管理上千人,几十个部门的决策者,你有时间去听网管给你解释每个参数的含义吗?答案是显而易见的。

其次是说:当企业领导询问IT运行情况时,我们只能回答好或者不好吗?当年终领导询问下一年的经费预算时,IT运维主管领导往往左顾右盼,只能说大概怎样。假设你是掌握财权的领导,你会对这样的答复买单吗?在需要IT运维部门说真话的时候,由于没有科学的证据,回答问题时没有公信力或者说服力,IT的价值和部门一年的辛苦可能就这样被无辜抹杀了。

最后是做:在这一点上,其实是在回答IT运维部门是做什么的问题。我们要清楚,现代企业的发展已经离不开IT技术的有力支撑,作为增强核心竞争力的法宝,企业不可能停止对IT的投入,但投入的最终目的是为了使业务系统发挥功效,实现利润与收益。在这条价值链上,IT运维管理在做什么呢?如果我们还停留在设备、网络、服务器这种底层监控阶段,无法与业务有机融合,那么不仅在企业的价值链中将永远看不到IT运维的身影,企业也将因为失去IT这一现代商业社会最重要的引擎而失速落败。

IT 运维管理三阶段 RIIL激活IT价值

对于IT运维管理部门来说,采用锐捷网络的RIIL激活IT价值,要做到有章可循,可以分为三个具体的阶段性操作来实现:

第一阶段:用RIIL搭建基础架构管理中心。并通过多种协议方式完成所有设备的采集,形成物理和逻辑拓扑图。模拟管理员日常工作行为,完成对服务器、网络设备、安全产品、数据库、中间件、Web服务、存储设备状态和性能的实时监控,帮助IT运维部门实现IT基础设施管理的可视化和自动化,降低管理复杂度,从而提高对IT基础架构的主动监管能力。

第二阶段:在基础架构管理中心构建完成之后,RIIL还提供了图形化的业务建模工具,用户可以根据实际环境,定义个性化的业务运行评估模型。从底层监控,再到业务视角、用户视角,对被监测资源进行关联、重组,建立真实表达业务内部关系的影响模型图,帮助用户快速搭建业务卡片视图,准确判断业务健康度、繁忙度、业务层级视图和业务告警等内容,客观评估业务运行水平,让IT投入的效益最大化,真正实现IT管理与业务管理的无缝融合。

第三阶段:关注IT整体健康指数,持续优化。要完成这一目标,可以使用RIIL中的一些具体的功能特性,例如RIIL中的IT健康指数。它是一条类似股票大盘的指数曲线, 如果出现下行趋势,则说明企业的IT系统正在变坏,出现了问题。同时与IT健康指数相关联的有一个业务雷达,可以显示出当前健康指数下行是由于哪一个业务系统的健康发生变化造成的,同时可以追溯到是什么IT资源发生了问题。

冯晋阳先生表示:站在业务的角度去做运维,站在科学的角度上去说运维,站在企业价值的角度去呈现运维,这三点就是RIIL能够帮助运维部门提升价值的关键。比如,在RIIL产品中,即使不够专业的用户也可以通过超大屏幕看懂运维数据、直观易懂的业务卡片、IT健康指数等等,这些功能都围绕着IT运维价值呈现这一核心要素。

云计算:拼的是运维

云计算的IaaS、PaaS、SaaS最后那个S都是Service。就是说,无论你云计算长成什么样,都得要向用户提供“服务”而不仅仅是软硬件和各种资源。

【云计算的技术难点】

到今天,云计算的工业实现已经不太难了。现在有开源软件KVM和Xen,这两个东西基本把虚拟化搞定;而OpenStack则把管理、控制系统搞定,也很成熟。PaaS也有相应的开源,比如OpenShift,而Java里也有N多的中间件框架和技术。另外分布式文件系统GFS/TFS,分布式计算系统Hadoop/Hbase等等,分布式的东西都不神秘了。技术的实现在以前可能是问题,现在不是了。

对于云计算工程方面,现在最难的是运维。管100台、1万台还是100万台机器,那是完全不同的。机器少你可以用人管理,机器多是不可能靠人的。运维系统不属于功能性的东西,用户看不见,所以这是被大家严重低估的东西。只要你做大了,就必然要在运维系统上做文章。数据中心/云计算拼的就是运维能力。

为什么说运维比较复杂,原因有这么几个。

一方面,云计算要用廉价设备取代那些昂贵的解决方案。所谓互联网的文化就是屌丝文化,屌丝就是便宜,互联网就是要用便宜的东西搭建出高质量的东西,硬件和资源一定不会走高端路线——比如EMC、IBM小型机、SGI超级计算机等等,你如果用它去搭建云计算,成本太贵。用廉价的解决方案代替昂贵的解决方案是整个计算机发展史中到今天唯一不变的事情。所以如果你要让夏利车跑出奔驰车的感觉,你需要自己动手做很多事,搭建一个智能的系统。用廉价的东西做出高质量的东西,运维好廉价的设备其实是云计算工程里最大的挑战。

另一方面,因为你机器多了,然后你用的又不是昂贵的硬件,所以故障就变成了常态,硬盘、主板、网络天天坏。所以,没什么好想的,运维就必须要跟上。云计算的目标是在故障成为常态的情况下保证高可用——也就是我们所说的,你服务的可用性是3个

9、4个9还是5个9。

最后,这一大堆机器和设备都放在一起,你的安全就是一个挑战,一方面是Security,另一方面是Safety,保证数十台数百台的设备的安全还好说,但是对于数万数十万台的设计,就没有那么简单了。

面对这样的难题,人是无法搞得定的,你只能依靠技术来管理和运维整个平台。比如必须有监控系统。这跟操作系统一样,对资源的管理,对网络流量、CPU利用率、进程、内存等等的状态肯定要全部收集的。收集整个集群各种节点的状态,是必然每个云计算都有的,都是大同小异的。

然后,你还要找到可用性更好的节点,这需要有一些故障自检的功能。比如阿里云就遇到过磁盘用到一定时候就会莫名其妙的不稳定,有些磁盘的I/O会变慢。变慢的原因有可能硬盘不行了,于是硬盘控制器可能因为CRC校验出错需要要多读几次,这就好比TCP的包传过来,数据出错了,需要重新传。在这种硬盘处理半死不活的状态时,你肯定是需要一个自动检测或自动发现的程序去监控这种事情,当这个磁盘可能不行了,标记成坏磁盘,别用它,到别的磁盘上读复本去。我们要有故障自动检测、预测的措施,才能驱动故障,而不是被动响应故障,用户体验才会好。换句话说,我们需要自动化的、主动的运维。

为了数据的高可用性,你只能使用数据冗余,写多份到不同的节点——工业界标准写三份是安全。然而,你做了冗余,又有数据一致性问题。为了解决冗余带来的一致性问题,才有了paxos的投票玩法,大家投票这个能不能改,于是你就需要一个强大的控制系统来控制这些东西。

另外,公有云人来人往,里面的资源和服务今天用明天不用,有分配有释放,有冻结,你还要搞一个资源管理系统来管理这些资源的生命状态。还有权限管理,就像AWS的IAM一样,如果没有像AWS的IAM权限管理系统,AWS可能会不会像今天这样有很多大的公司来用。企业级的云平台,你需要有企业级的运维和管理能力。

【云计算的门槛】

为啥云计算有这么多开源的东西,却不是人人都能做?

一方面,这就跟盖楼一样。盖楼的技术没什么难的(当然,盖高楼是很难的),但是你没地你怎么盖?云计算也一样,带宽的价格贵得就像土地的价格。其实云计算跟房地产一样,要占地、占机房、占带宽。如果能把中国所有的机房、机柜、带宽资源都买了,你就不用做云计算了,卖土地就够了——因为这些是有限的。最简单的例子,IP地址是有限的。你有带宽、有机房,但是如果你没有IP,这就不好玩了。尤其是你要提供CDN服务,这个就更明显,因为有多少物理节点直接决定你的CDN服务质量。

另一方面,正如前面所说的,运维是件很难的事,运维这个事并不是一般人能搞的事。没有足够的场景、经验和时间,这种能力很难出现。

从用户的角度来说呢,云计算是一种服务,你需要对用户企业内的解决方案要有很好的了解,这样才能提高很好的服务。能提供“好服务”的通常都是把自己真正当成用户公司。

卖汽车也是卖服务。造出汽车来,并不代表你搞定这个事了。如果没有公路、没有加油站、没有4s店、没有交通管理、规则等等,你要么用不了,要么就是乱七八糟。不能只让用户在那看着你的汽车好牛啊,但是用户不知道怎么用。所以说,云计算最终旁边必须要有一套服务设施,而这套服务设施也是今天被人低估的。

云计算有两个东西是被人低估的,一个是运维,一个是那堆服务。做服务的需要有生态环境,有人帮你做。所以做云计算要落地并不简单。

总之,云计算是需要吃自己的狗食才能吃出来的,绝不是像手机上的Apps一样,你想一想、试一试就能搞出来的,你首先需要让自己有这样的场景,有这样的经历,你才可能会有这样的经验和能力。 还是那句话,云就是服务,只要提供了好的服务,无论公有还是私有都是会有价值的。

“云安全”解决方案

作者:佚名 文章来源:销售部 点击数:16 更新时间:2014-10-30 10:22:25

从2011年索尼、纽约交易所网站被攻击,到年底CSDN、天涯、人人等大型网站被拖库,继而2012年美国中央情报局网站、我国国防部网站频繁被攻击,乃至到近期发生的新加坡总理网站被入侵„„显而易见,网站一直都是网络攻击、网络犯罪的重灾区。当前的攻击者更专一,更倾向于有价值的目标,政府、企业的网站往往首当其冲。很多用户的信息网络甚至内部的办公、生产系统被入侵,而攻击者们大多都借用了用户的外部网站作为攻击的“跳板”。不夸张的说,网站的安全已经成为信息安全保卫战的第一道防线。

如何应对这些花样繁多,似乎永无休止的安全威胁?这让网站的管理者头疼不已,可对于知道创宇科技来说却不是一个难题。作为一家专注于互联网安全的企业,知道创宇科技在对网站的安全防护上有着非常成熟的经验,他们先后推出了WebSOC网站立体监控系统,KS-WAF网站统一防护系统,Websaber网站应用安全评估系统,为网站提供立体全面的监控和防护。其中加速乐产品为网站提供一站式的加速、安全解决方案,得到了二十多万用户的广泛应用。面对层出不穷的网络攻击,知道创宇科技本着“魔高一尺道高一丈”的精神,潜心研发,创新发展,对产品不断更新换代,力图在这场网站攻防战中抢占先机,牢牢把握主动权。

近日,知道创宇科技产品总监金皓在采访中告诉记者,知道创宇科技将对产品线做重大调整,不仅要对公司的拳头产品WebSOC进行大幅升级改进,还要推出一款明星产品WebTrack,帮助企业用户在愈演愈烈的网络攻击中彻底做到安全无忧。

金皓着重提到,云计算的流行,使得越来越多的攻击开始针对云平台,攻击者现在只要攻破一个云平台,就能获得大量用户的隐私和数据,远高于攻击单个网站所带来的价值。例如10月Adobe确认其云端服务平台遭到黑客攻击,其后曝出的受害用户数量远远高于预计。之后,很多大型网站如Facebook、Yahoo等也被殃及,为了让其用户不受到该攻击的影响,被迫要求部分用户修改密码。

现在云平台使用的很多第三方组件都存在漏洞,安全情况堪忧。针对这种趋势,新版的WebSOC集成了大量的POC漏洞验证规则,以接近黑客的攻击思路,堵住了来自第三方应用组件的漏洞,对云平台的防护又更进一步。

如果说在网站的防护上,WebSOC已经做到无所不在的监控,那么,对于针对网站的种种攻击和可疑行为,怎么样知道它们要做什么?或者是已经做了什么?它们到底来自哪里?用户该如何判断? 对此,知道创宇科技也有应对良方。金皓透露道,知道创宇科技于12月推出一款全新的产品WebTrack,它能对行业、区域的整体安全进行统计及态势分析,通过自带的IP信誉档案库,可以对黑客建档、取证及追踪,实现行业、区域的统一管理,还可以进行虚拟补丁的快速分发,从而给用户提供持续在线的保障能力。

为什么要在这个时候推出WebTrack?据金皓介绍,WebTrack的技术基础是奠定在加速乐产品在二十多万个互联网网站的大规模应用上,而当前政府和行业网站的严峻局面,也促使了WebTrack的诞生。区别于单一的网站安全防护产品,WebTrack的定位是综合性网站防御体系平台。它采用了在实践中已验证成熟的架构,更侧重于网站的安全性,主要面向区域性的、行业性的政府、企业用户。

WebTrack系统可以记录所有被保护网站的被攻击日志,通过搭建数据中心,可纵向查看网站所有历史数据,并可横向查看相同类型事件的多网站关联数据,以实现对这些数据进行的离线三维关联及聚类分析,最终从众多线索中追溯攻击源头。同时,对行业和区域整体安全环境进行保护、分析和预警。单个网站的防护也因在整体安全态势的大背景下更易发现风险,并及时作出相应策略。

金皓进一步对WebTrack进行了解读。他比喻道,网络上的攻击态势对众多用户来说,更像是进行一场网络反恐战争。用户非常需要知道攻击者从何而来,对什么信息感兴趣,做了哪些行为,此时WebTrack就相当于一个综合防御系统。 首先是预警功能。得益于加速乐等产品的大规模应用,知道创宇科技建立并不断更新着一个庞大的IP信誉档案库,一经发生网络攻击,就可以从源头上进行判断,提出预警。

接着是第二道防线,对正常IP所产生的行为,通过各种规则进行安全防护。知道创宇科技通过对海量的网站攻击数据的分析建模,建立了各种数据库,如黑客档案库和他们常用的攻击手法,攻击代码特征库,以及各种应用的漏洞库等等。这些数据库生成了各种防护规则,并实时下发更新。如果流量出现异常,就可以通过规则关联匹配,判断这个行为是否有恶意动机,从而做出正确判断。

最后,系统具备完善的日志分析功能。如果攻击者利用了未知漏洞或者其他因素成功进行了攻击,系统会通过日志分析做深度的挖掘,将这些隐藏的恶意行为曝光出来,并记录在案,反馈到知道创宇的云平台,确保类似的行为不会再次得逞,并且不会在别的地方发生。值得称道的是系统对所有的攻击行为都可以追查源头,这对很多用户来说是一个非常有用的功能

政府办公桌面虚拟化解决方案

政府单位业务系统众多,且往往涉及到国家机密信息。政府单位的桌面IT系统面临着数据安全性、桌面系统维护、业务连续性保障等诸多挑战需要解决:

1、数据安全性有待提升。办公人员的工作内容往往会涉及到机密信息,需要进行有效的数据安全性防护;但众多的终端PC却很容易导致出现移动磁盘拷贝、黑客盗取信息等数据泄密渠道,影响到机密数据的安全;

2、桌面终端系统维护困难。接入办公网络的终端数量众多,在当前大量使用PC的情况下,所有终端的操作系统、补丁升级、业务软件都需要在每台PC上分别实施,耗费巨大的人力物力,费时费力,效率低下;

3、业务连续性缺乏保障。由于终端数量众多,安全保障任务艰巨。而终端PC是最容易被病毒、木马攻击的对象,一旦某台PC被攻击就可能导致整个办公网络的业务系统崩溃;

方案设计

基于以上对政府单位的终端桌面系统的问题和需求分析,我们推荐采用北京东方荣华有限公司的桌面虚拟化解决方案,从而有效防止关键数据和信息泄密,大幅提升终端的IT运维效率,实现业务连续性保障和节能减排等目标。

方案设计目标

1、数据和信息安全:通过桌面虚拟化方案,单位所有人员使用的桌面系统及业务系统都集中在数据中心运行,所有业务工作实际保存、运行在数据中心的服务器,用户只能远程看到运行程序的图像,大大保证数据的安全;另外,管理员通过应用内置的安全策略,可以让用户无法将文件和信息保存在本地设备或移动磁盘上,防止机密数据随便被拷贝造成的泄露,从而有效实现数据安全和信息安全;

2、终端管理维护方便:通过桌面虚拟化方案,单位可以通过虚拟桌面池、虚拟桌面模板克隆等技术实现快速桌面部署,单位所有的终端设备使用的操作系统全部来自一个由管理员定制的标准化操作系统,该镜像中已安装了业务所需要的应用程序及应用客户端软件,对于前端客户端的桌面与应用维护工作量,就缩小到只需对一个镜像进行维护。另外,桌面和应用的安装和升级等全部在集中数据中心进行,IT管理员无需接触最终用户的客户端,就可以完成应用的配置和维护工作,避免每台PC机装机,以及故障时重装等,大大减少维护工作量,提升效率;而终端由PC替换为云终端后,其本身不用安装应用软件,可以做到在运行期间终端免维护,降低终端维护成本;

3、业务连续性保障:桌面虚拟化方案可以在服务器端对业务系统和所有终端进行快照、备份等技术部署,从而将意外故障停机时间和恢复时间降到最低;此外,解决方案采用本地无操作系统和应用软件的云终端,极大的降低了由于病毒入侵或是办公人员对操作系统的非法操作引起的办公网络崩溃或是系统宕机的风险,提高了电子政务系统的高可用性及高可靠性。

4、防止数据丢失与损坏 :所有业务数据文件都统一保存在数据中心,由IT人员统一进行管理、定期备份与恢复,从而避免终端用户个人保管不当造成的数据损坏和丢失;

5、节省办公空间:通过桌面虚拟化方案,可以用云终端来替代传统PC;而云终端体积小,可以通过螺钉直接固定在显示器后面,节省办公空间,相同办公区域内可以容纳更多的办公人员;

6、降低终端持续更新费用:PC机平均更换周期为3~5年,而云终端如无人为损坏,工作时间平均为10年左右;服务器的使用寿命也远高于PC机;虚拟化软件License可以永久使用;

7、持续扩容费用低:后续增加办公人员,无需采购PC机,只需要按需采购云终端即可。扩容服务器处理能力时,可通过扩充CPU和内存来实现。

8、节约能耗,绿色IT:云终端能耗低(小于10W,平均5W),云终端+服务器方式比传统PC机节约能耗约75%,绿色环保。