机房运维管理制度

2024-05-06

机房运维管理制度(共8篇)

篇1:机房运维管理制度

运行维护规章制度-机房运行维护

1、机房及其设备由专人负责防故障防火防盗,进出机房所有人员要做好记录,严禁一切非工作人员在任何时间进入机房。

2、机房卫生:每天有值日人员打扫卫生,要求:地面清洁,无纸屑、杂物、污点,桌椅窗台无灰尘。

3、机器维护:要求值班人员时时监控服务器运行状况。出现状况及时汇报、维护。机房值机人员随时检查机器的运行状况,要求发现故障进行维护的同时进行上报。

4、交接班记录:每天值班人员填写交接班记录,事后发现过失由接班人员负责。

5、机房管理人员有责任对管理密码进行保密,不得泄露管理账号和密码,一旦发现密码过期应及时更改。

6、机房管理人员有责任对数据库进行定时备份,并且有责任在确保所有运行数据安全可靠。发现问题应该及时同其他相关部门取得联系。

7、机房管理人员要随时保持机房电力和网络通畅。如果出现断电和断网的情况,应该立即采取补救措施并且做好记录。

8、对于采用window系统的服务器,机房人员需要每星期对其进行系统升级。如果有安全问题必须立即升级。

篇2:机房运维管理制度

(4)机房设备布局 ① 尽量缩短 UPS输出配电柜不电源列头柜之间的距离; ② 每列机柜之间的距离,最好符合活动地板的模数,避免 出现<30cm的补边; ③ IT机柜各列之间,宜“背靠背”(“面对面”)排列,形成冷、热 通道,并丏不空调机送风方向平行; ④ UPS、空调机、配电柜、蓄电池组,都要留出检修空间; ⑤ 重要功能的IT设备,宜靠近空调机送风口区域; ⑥ 活动地板下的电缆桥架、线槽,丌应阻挡空调机送风,并丏应 该架设在空调机上、下水管上方; ⑦ 新风机丌应安装在吊顶内,送进的新风应不空调回风混和,新风 出风口下方丌应安装感烟、感温探头和各种机柜; ⑧ 空调室外机安装位置,应该注意:排风无遮挡、进风无热源、噪音丌扰民、配有上下水; 2012区域数据机房建设及运维高层论坛

(5)技术处理 ① 楼板承重: 视功能区划分,300㎏/㎡、500㎏/㎡、1000㎏/㎡ 机房下层加设梁柱、机房地面增加反梁或碳纤维加固等。② 新风进气:可考虑利用楼内走廊、VRV空调。③ 室外机噪音:调整安装位置和方向、增设隔音挡板。④ 机房防水:围封立管、漏水报警。2012区域数据机房建设及运维高层论坛

篇3:网络中心机房的运维与管理

关键词:网络中心,机房管理,运行维护

一、网络中心机房的环境要求

(一) 电气环境要求。

防静电和防电磁干扰是机房电气环境要求的主要内容。由于网络设备内部电路采用大量的半导体MOS、CMOS等器件, 这类器件对静电的敏感范围为25~1, 000v, 而静电产生的静电电压往往高达数千伏甚至上万伏, 足以击穿各种类型的半导体器件。因此机房地板或地面应有静电泄放措施, 如有条件最好安装防静电地板;工作台面宜采用导静电或静电耗散材料。地板支架、机房内所有设备的金属外壳要接地;静电接地的连接线应有足够的机械强度和化学稳定性。工作人员移动设备时要轻拿轻放, 减少因频繁走动产生摩擦进而产生静电。电磁干扰对网络设备的影响不可小觑, 无论对软件还是硬件都可能造成或轻或重的损害。同时, 网络设备本身也会产生电磁辐射, 对临近的电子设备也同样有电磁干扰的影响。因此, 可以通过采用屏蔽、滤波、改良布线方式等方法来降低电磁干扰对设备的不利影响。另外, 选择设备本身具有抗电磁干扰设计的网络设备, 也能起到较好的抗干扰作用。

(二) 温湿度要求。

路由器、核心交换机、服务器等设备对机房温度十分敏感, 要求较高。当温度偏高时, 网络设备散热不畅, 电子元件寿命降低, 易造成系统宕机的威胁, 影响通信线路的稳定、可靠传输。为保障网络设备24小时不间断运行, 严格控制机房温度则显得尤为重要。一般情况下, 机房温度夏季控制在23℃左右 (可上下浮动2℃) , 冬季控制在20℃左右较为适宜。同时, 湿度对网络设备的影响也很大。湿度偏高, 容易造成金属部件氧化腐蚀, 并引起电路板、布线等绝缘材料的绝缘性能降低, 甚至造成电路短路。空气太干燥又容易引起静电, 损坏电路板。一般说来, 机房内的相对湿度应保持在40%~60%范围内较为适宜。

(三) 防尘要求。

服务器、网络设备等在工作运转过程中会产生高压与静电并吸附空气中的灰尘, 电子器件等受灰尘和空气中水分的影响容易造成绝缘性降低和接触不良。由于机房空间狭小, 长年累月线路板上吸附的灰尘会越积越多, 设备在运转过程中出现故障的可能性也越来越大。通常表现为电路板告警。此时, 可通过对电路板重新插拔并清洁插针周围的灰尘使其恢复正常。机房应具有良好的防尘措施和效果, 门窗缝隙、电缆出入口、机房地面、机柜、设备等处都需严格做防尘处理;进入室内的空气必须经过新风机过滤;设立缓冲间, 工作人员要换鞋后才能进入机房, 以最大限度的将粉尘阻隔在主机房区的外面。

(四) 防火要求。

机房应为独立的防火分区, 机房的外墙应采用非燃烧材料。进出机房区域的门应采用防火门或防火卷帘;穿越防火墙的送、回风管, 应设防火阀;机房及楼道内应装有温度烟雾感应器及防火报警探测头。在遇火情时, 系统自动报警并启动惰性气体灭火系统灭火。机房内应配备手提式或推车式灭火器并保证其有效性。机房管理人员必须抱着高度的责任感在日常勤于对线路、危险源进行检查确认来保证。具体包括:制定完善的防火制度;保证疏散通道的畅通、安全标志明显;机房内计算机布局合理, 线道规范;合理正确使用用电设备。

(五) 防鼠、虫害要求。

机房在防鼠、防虫方面如若措施不当, 也极大地增加了设备损坏的风险。当老鼠进入机房后, 不仅咬断电缆、尾纤, 其排泄物更可能直接导致设备损毁。对老鼠、虫害的防护可通过多种防护进行:在机房、设备间门口放置防鼠板;各种孔洞要用防火材料封堵;线槽封闭, 尽量不暴露裸线;线缆出入口以铁丝网封堵较好;机柜门平时保持关闭。同时, 还要严格杜绝食品进入机房。

二、网络中心机房IT设备的运维

设备日常维护主要以预防为主, 防患于未然。在维护过程中善于发现潜在故障, 找出诱发原因, 消除隐患。

(一) 网络故障的分类。

网络故障按其性质可分为物理故障和逻辑故障。物理故障也称为硬件故障, 指设备插头松动、线路损坏或受到强烈电磁干扰等情况。故障表现通常是网络时断时续或完全断开。工作人员可先采取直接观察、插拔等基础方法判断设备声音是否异常, 指示灯有无错误提示等;也可通过程序诊断和仪器检测进行进一步的诊断;或直接用新设备或新模块做替换。

逻辑故障也称为软件故障, 主要是由于设备配置等软件引起的故障, 相对于硬件故障要更为复杂。通常表现为网络协议问题、IP地址冲突等问题造成网速缓慢、时断时续、页面加载超时等。可通过重要数据双机热备份, 重启端口或重新端口配置、IP地址统一分配管理等方式来完成。

(二) 网络故障诊断和排除的一般方法。

排除网络故障要根据故障的表现情况分析可能引起故障的各种原因, 逐一排除, 缩小排查范围, 最终确定问题的症结。首先, 判断该故障是个案故障还是网络整体故障。如果是前者, 往往是由于操作过程不当、权限设置有误或本地计算机故障等原因造成;如果是后者, 则需把工作重点放在集线器、协议转换器、路由器或线缆等特定组件上, 按照通信线路结点依次做环 (包括内环、外环) 检测。必要时, 可联合电信运营商一同排查。其次, 在检查故障过程中, 应及时做好相应的文字、数据、方法等记录, 以便有据可查, 有源可溯;在问题得到解决后还应测试网络效果, 确保该网络故障排除后并未由此产生新的网络问题。第三, 善于归纳、总结和思考, 为以后的网络管理提供数据和经验。

三、人员要求

机房的运维和管理目前还是以智能监控为辅, 人员管理为主的一项工作。因此, 对管理人员提出的要求也是相对较高的。一是增强岗位责任心, 强化服务意识。二是机房管理人员要具备良好的专业技能和职业素养, 熟练掌握各种系统和设备的操作和配置, 在工作中不断积累经验, 努力提高自身知识业务水平。三是关注行业发展动态, 增加与同行工作心得、技术交流的机会。四是机房管理人员应设置A/B岗和有效的管理梯队, 保证机房管理不脱节。

四、网络安全

(一) 安装硬件防火墙。

安装硬件防火墙, 有效保证网络的安全。定期检查防火墙的设置, 查看有没有黑客入侵的行为, 及时做好更新升级工作, 确保防火墙的正常运行。

(二) 安装并更新防病毒软件服务器。

计算机病毒产生非常快, 具有较强的破坏性及传染性, 充分利用防病毒服务器对客户端的防病毒软件进行管理, 自动更新相应的病毒库。

(三) 做好内网和互联网的隔离。

从通信线路上做好机房内、外网交换机的物理隔离。机房中通过内网线路连接的服务器及其他网络设备, 统一分配、绑定IP地址以防他人篡改。

(四) 对常用软件及操作系统进行定期的补丁更新。

常用的应用软件及操作系统一定要做好定期的补丁更新, 不然系统中的安全漏洞就会遭到相应病毒的攻击, 比如蠕虫病毒、冲击波等等就是很容易出现的病毒。可以通过补丁更新服务器对操作系统进行系统补丁的统一分发, 减少维护人员的工作总量。

五、结语

网络中心机房的运维与管理是一个系统性的工作, 需要各个层次上的有效部署和紧密配合。要增强技术能力, 提高管理水平;资源分配要合理并提高利用效率;加强防范措施, 确保机房安全运行等。相信通过这些措施科学地维护和管理机房, 才能达到提高机房运营效率的目的。

参考文献

[1] .电子信息系统机房设计规范GB50174-2008[M].北京:中国计划出版社, 2009

[2] .张成泉.机房工程[M].北京:中国电力出版社, 2008

[3] .辛全民, 贾晓杰.漳卫南局专网通信机房的维护与管理[J].海河水利, 2008

篇4:高校机房的运维管理

关键词:高校 高校;机房 机房;运维 运维;管理

中图分类号:TP308 文献标识码:A 文章编号:1007-9599 (2012) 09-0000-02

一、引言

教育信息化的快速发展,促进了教育的现代化。高校机房承担了大量的实验实践程,随着信息化课程比例的提高,学生课余上网、完成作业都需要使用机房,这就需要高校机房安装相关的软件。系统不稳,机器超负荷,因大学生有强烈的好奇心而更改系统,操作恶意软件等等对运维管理工作带来种种困难[1]。为了确保机房为高校教学科研服务,必须改善其运维管理。

二、高校机房的运维管理问题

当前,高校机房的面临的问题主要是课程多,学生人数多。为了提高学生的动手实际操作能力,符合教改的要求,会安排较多的课内外的上机实验。这加重了高校机房的运维管理任务。第二,学生的使用U盘带来病毒,通过软件工具修改破坏正常系统。上课时聊QQ、玩游戏会影响学生的学习效率。这困扰着运维管理老师。此外,使用年限久,因使用频率高,自然损耗加大。

三、提高运维管理的手段

1.(一)在硬件方面

对高校机房的硬件设备进行日常运维管理,要定期定时清理机房硬件污垢,利用插拔方法手段进行判断,同时也可利用检测工具协助及时发现硬件问题[2]。粘贴醒目提示语,非机房专业管理员禁止移动设备,禁止对服务器进行配置修改,绝对禁止在机房使用黑客工具。

对于显示器的运维管理,在工作的流程如下:

图1 显示器运维流程示意图

第一步,当不显示故障出现,首先查看电源开关,是否正常打开。

第二步,在正常打开的状态下,调节显示亮度,查看亮度是否被调试为0。

第三步,如果亮度也是正常状态,重新插拔电源,听一下是否有加电时的声音。

第四步,如果加电正常,断开与主机相连接的接口,显示器上出现如“no connection”、“no display”类似的信息,可以确认显示器正常,否则,显示器内部出现故障。需要进行电路板级的维护。

对于内存故障,主要是发出长鸣的声音提示。如果经常意外的蓝屏或者系统明显速度变慢需要更换内存才能快速解决问题。一般情况可以先试着用橡皮清理金手指,同时一定要用小刷子清理内存槽的灰尘,这样可以将问题解决。显卡如果有问题也可以参考这种方法,另外还可以通过降低分辨率、安装官方驱动程序来解决显卡的问题。

对于CPU和主板方面的故障,可以打开主机箱看一下主板是否不平,长期在高温状态下工作会造成主板变形。芯片出现问题需要用检测卡来检测,对于CPU故障应该是烧掉了,更换可解决问题。

利用还原卡来保护系统文件和硬盘是当前在机房普遍采用的方法。因为基于底层设计,兼容性好,脱离硬盘工作,不占用常规内存等资源,可对分区及CMOS设置进行保护。不管计算机受到一般病毒入侵还是由学生试验修改,都可以在重新引导后恢复。LENOVO的计算机在硬件保护方面做得非常有影响力。

2.(二)在软件方面

高校机房承担众多课程,进行教学科研使用,机房的规模随着教育信息化的发展在不断的扩大,应用软件升级、操作系统更新,同时,机房计算机受病毒木马攻击、学生对Internet的好奇,恶意操作经常发生,机房管理教师面对上百台的计算机,如果一台一台的修复,势必不堪重负,工作效率大大降低,如何提高机房运维管理的效率,确保学生上课正常使用是每一位机房管理教师值得思考的重要问题。

针对软件故障,可以有两种方法来解决:U盘和Ghost恢复[3]。

随着U盘技术的发展,其容量越来越大,8G、16G、32G的U盘已经是非常普遍,机房管理教师可以利用制作好的U盘作为机房的维护工具。老毛桃,电脑店都是非常好用的制作工具,集成了Ghost、Winpe等。具体制作方法如下:

圖2 U盘启动盘制作流程示意图

图3 启动盘制作过程抓图之一

使用具有启动功能U盘维护系统方法如下:

第一,在需要维护的电脑中插入制作好的U盘。

第二,打开或者重新启动电脑进行BIOS中设置启动项。

第三,选择HDD或者ZIP模式进入启动菜单。

第四,选择启动成功的菜单中的工具进行维护操作或者进入Winpe系统后进行维护。

总之,在高校机房的维护管理中,充分感受U盘启动功能带来的方便,它使用方便,随身可带,随时使用。对于系统引导失败、感染病毒、文件误删除等操作都可以利用一个小小的U盘轻松解决。另外,利用U盘可以集成多款软件于一体,可以进行硬件的修复,单独作为硬盘来运行都可以,部分高校机房通常没有光驱,使用U盘刚好可以解决这个问题。

如果不是各别的计算机维护,如在学期末或者学期开学前对机房进行全面的维护,以确保新学期的教学正常进行,需要使用Ghost软件。它是目前在高校机房进行备份、升级、恢复系统的广泛应用软件。使用中结合DHCP技术可以进行网克,大大提高机房管理的工作效率[4]。

制作流程如下图:

第一,制作母机。将母机硬盘格式化,以免病毒木马被意外带入。母机和工作站的硬盘分区等相关的参数保持一致。对母机的硬盘合理分区,采用NTFS格式对母机进行格式化,可提高其工作的稳定性,为了提高系统性能,对其注册表进行清理,磁盘碎片整理,对全盘进行病毒木马的查杀。将所有需要的应用软件合理安装在母机上,并逐一操作测试,确保正常使用。制作一个安全、稳定、可靠的母机。

第二,制作母机镜像文件。对已经安装好的母盘制作镜像文件,可利用前面提到的U盘对整块母盘制作成GHO文件。方法为:进行winpe系统后,启动Ghost.exe程序,选择disk to image功能。设置母亲的DHCP网络配置,设置Internet协议为自动获取IP和DNS。具体操作方法是:打开“控制面板”—>双击“网络连接” —>双击“本地连接” —>单击“属性”按钮—>双击打开“Internet协议(TCP/IP)”—>选中“自动获得IP地址” —>选中“自动获得DNS服务器地址” —>单击“确定”按钮。

第三,多播Ghost实现。多播Ghost是将前面制作的母机的镜像文件通过网络途径,批量恢复到所有的工作站中,一旦客户端加入到多播克隆的任务中,机房内的所有安装有客户端的计算机就可以同时完成克隆任务。

具体操作描述如下:首先,选择一台计算机作为服务器,安装上有DHCP功能的服务器系统,如windwos server 2003,配置好DHCP服务。安装上GHOST软件,制作网络启动盘,操作方法为:运行ghost.exe,之后选择ghost boot wizard菜单中的 network boot disk,之后直接添加网卡驱动,生成多个具有ghost cast 和tcp等服务网络支持的ghost启动盘,可以用U盘来做。运行Ghost软件中的多播服务程序ghost cast server。输入session name并加载restore image 。在image file中指向母机镜像GHO文件。选择disk中的accept clients按钮以接收客户端。利用引导盘启动工作站,运行客户端,登录到ghost cast上,并选择多点传送方式。最后,当所有客户端登录成功,在服务端单击send按钮,即可开始进行多播Ghost。

第四,自动更改计算机名。收集机房内的MAC地址,建立一个批处理文件,运行之即可。更名完成后,对机房内的工作站进行抽样检查,确认无误后,实施硬件的还原保护。

3.(三)在管理制度方面

为了充分发挥机房的教学科研服务作用,针对授课计划,首先根据人数,专业班级情况合理分配上机的时间和地点。第二,各建立上机日志[5]。由授课教师上课时记录机房的使用情况,故障备注,以便于及时发现问题,解决问题,确定教学顺利进行。同时对上机日志建立档案。第三,对学生上机要求按学号入座,上机记录等各种信息按机号登记,责任明确到个人,减少恶意破坏带来的损失。第四,加强网络信息安全教育。及时升级杀毒软件的病毒库,对学生进行信息安全教育,提高系统的安全性,定期备份磁盘中重要数据。第五,对于使用U盘的情况,学生必须在杀毒后才可以使用。第六,引入学生管理员,协助管理机房。第七,机房运维管理人员加强设备的保养。加强设备及时维护和科学的保养,可以降低费用,相对延长計算机的使用寿命。

四、结束语

高校机房的运维管理繁琐,作为机房管理教师必须不断学习专研新的管理方法和技术,多种方法结合,取各家之长,加强机房运维管理手段,提高其稳定和安全性。才能更好的发挥机房的教学科研之用,更好的服务于教师和学生。

参考文献:

[1][1]文雪巍.浅谈高校计算机机房维护[J].中国科技信息,,2006(,5).

[2][2]戴忠朝.运用Ghost和电子教室软件维护网络机房[J].].中国教育技术装备,,2007(,5).

[3][3]陈经艳.高校计算机机房的管理和维护策略[J].科技经济市场,2007(,6).

[4][4]Joseph Davies(美)著.杨轶,,苏啸鸣,,吴超译.深入解析IPv6(第2版)北京::人民邮电出版社,,2009.6

[5][5]王爱宁..关于IPv4向IPv6过渡的有关探讨..信息与电脑(网络技术),,2009.,12

[作者简介]

篇5:机房运维述职总结

转眼间,来xxx已经快一个月了,在领导的正确领导下,在办公室其他成员的帮助和配合下,一月来,能比较积极的学习业务,比较认真的履行工作职责,较好的开展和完成了自己的工作。在这一个月里,虽然没有轰轰烈烈的成果,但也使我经历了一段不平凡的考验和磨练。

现将工作总结如下。

一、对机房的每日巡检已成为习惯

由于之前的工作一直接触的机房,在机器管理与维护方面上也有一定的经验,能较为快速地掌握机房机器管理与维护的基本步骤和操作,以良好的姿态对待岗位工作。每天准时上下班对机房的动力环境的检查以及记录已经成为一种习惯。观察并记录机房温度、湿度并通过一系列的设备改变机房环境,保证机房的设备在稳定的状态下运行,同时掌握市电、ups的供电电路情况,每天记录电压、电流,随后简单的观察机柜里服务器的运行状态,有无红灯,断电情况。做到每个机房每天的情况都掌握在心里。出现问题能及时找出原因。

二、出现问题并及时解决问题

在这段时间,机房主要出现过以下几种情况:

1、中心机房市电断电。某一天的下午机房被通知市电需要断电半个小时,原因是由于道路市电供电电路在维修,得知市电断电通知后,紧急做好机房ups供电应急预案,断电时机房使用电池供电,与同事配合检查记录在断电的时间内,各个系统的运行状态,并积极联系工程部同事,掌握通电时间。

2、室外乐园机房湿度过高。由于前段时间,一直处于梅雨季节,室外机房湿度高于80%,如果计算机机房室内湿度过高,就会在计算机元件上形成凝结的水滴,因此导致设备寿命变短。其次,湿度过高会导致冷却系统表面形成水滴,这会使冷却设备的效率降低。收到短信报警时,虽然是下班后,紧急来到机房,将三台空调的除湿功能开启,在机房环境稳定后才离去。

3、中心机房环境监控系统的温湿度设备。出现故障报警。通过系统发现设备的故障点位,然后查看事件记录,判断故障原因,最后通过重启设备解决了此类故障,但是这次的故障已记录下来,以便要求下次设备厂家的人员给出合理的解决办法。

三、工作中的不足与今后的努力方向 尽管对公共机房这块的工作顺手得多了,但在有关办公室管理方面的工作做得还详尽细致,以致有时手忙脚乱,力不从心,办事效率不高。在今后的工作中要一如既往的加强学习,更加深入的了解办公室的管理工作,以努力提高自己的工作能力及业务水平,力求在今后的工作中,更加进步,做好机房的管理、维护及办公室管理、协调工作。不辜负领导对我的关心和信任,以及同事对我的帮助和支持。

篇6:机房运维质量分析报告

一、本月容灾备份中心运维情况:

1)巡检内容:机房内4台精密空调、2台存储设备、31台服务器、17台网络设备、1台NVR录像机

2)巡检方式:对各系统设备进行物理状态查看,机房内安全隐患排查。

3)巡检次数:本月共计进行180次巡检维护。

4)机房内设备故障处理:本月共处理2起故障,1起故障原因为EMC出现两个电源模块告警、1起故障原因为UPS出现一个电源模块告警。

5)PC桌面维护:本月PC桌面维护2起:

4月17日,永宁办公电脑出现无法进入综合管理平台办理相关业务,经过检查为PC浏览器故障导致,重新安装PC浏览器后故障恢复。

4月19日,永宁办公电脑出现证书无法登陆故障,经过检查为证书驱动文件丢失导致,重新安装证书驱动后故障恢复。

6)高速支队托管设备告警通报:本月通报0起。

二、人员/设备进出机房情况:

1)人员进出情况:本月3人进入机房,其中2人因空调故障事故进入机房进行空调维修工作,1人因UPS故障事故进入机房进

行UPS维修工作。

2)设备进出情况:本月有2台设备(深信 AF-1620防火墙1台、深信 AF-1820防火墙1台)出库,拿至省信息中心机房使用。

三、机房动力环境系统运行情况:

1)空调系统:本月4台精密空调运行正常,无告警。2)UPS供电系统:UPS电源系统负载利用率为20%,设备出现一个电源模块告警。

篇7:机房运维管理制度

目录

运维管理规范--------------4 1.目的------------------------4 2.适用范围------------------4 3.规范性引用及参考-----4 4.本文术语,定义和缩略语---------------------------5 5.基本要求------------------6

5.1运维管理原则-----6 5.2制度和流程管理6 5.5供应商管理--------7 5.6督促检查-----------7 6.运行维护------------------8

6.1日常操作及监控分析--------------------------8 6.2 数据与介质管理-8 6.3机房管理-----------9 6.4 网络管理----------9 6.5 弱电管理---------10 6.6桌面维护----------10 6.7服务器及系统变更----------------------------11

6.8 配置管理---------12 6.9 事件与问题管理 12 7.应急管理-----------------12

7.1应急准备----------12 7.2应急处置----------13

运维管理规范

1.目的

为规范公司运维工作,使相关工作具有持续改善及相互协作性,同时加强计算机设备的管理及维护,确保维修工作的及时性,降低计算机设备的报修率,实现业务与技术的融合,将业务部门与IT 部门紧密结合在一起,根据公司管理要求及计算机应用的需要,由运维部制定。

2.适用范围

本规范规定了运维管理工作的要求。

本规范适用于维信理财集团(中国)总部,包括全国各分部及门店。

3.规范性引用及参考

◆ IT 服务管理国际标准ISO/IEC 20000 ◆ 企业获得ISO/IEC 20000认证的权威指南 ◆ 全球著名IT 服务管理书库(ITSM Library)◆ IT 服务质量管理原则

◆ 理解ISO/IEC 20000在IT 服务中的地位 ◆ ISO/IEC 20000规范和实践准则 ◆ IT 服务管理国际标准ISO/IEC 20000 ◆ GB/T 20269—2006 信息安全技术 信息系统安全管理要求

◆ ISO 31000:2009 风险管理 原则和指南(Risk management--Principles and guidelines)

◆ JR-T 0060—2010 金融信息系统安全等级保护基本要求 ◆ JR/T 0074-2012 金融IT 服务管理基本规范 ◆ 中国金融标准化报告(2011)

4.本文术语,定义和缩略语

1、IT: Information Technology 信息技术

2、DNS: Domain Name Service 域名服务

3、DHCP: Dynamic Host Configuration Protocol 动态主机配置协议

4、VPN: Virtual Private Network 虚拟专用网

5、OA: Office Automation 办公自动化系统

6、ISO: International Organization for Standardization 国际标准化组织 编订日期:30.7.2014 批准日期: 生效日期:

7、故障: IT设备或系统丧失规定的功能,导致服务中断或降质,或对正常运行造成潜在威胁。

8、异常: IT设备或系统的状态发生超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维人员关注或处理。

9、资料: IT设备或系统的运行记录,包括IT 设备或系统的配置、故障历史记录、软硬件扩容或调整记录、权限变更申请记录等。

10、运行维护:本规范中的运行维护包括IT 基础设施维护、IT 应用系统运维维护、安全管理、网络接入、内容信息以及综合管理等。

5.基本要求

5.1运维管理原则

公司按集中与分散相结合的原则,设立机房、各部门配备电脑。计算机系统本着“总体规划、分步建设”的方式实施建立。

计算机系统建设应综合考虑成本、费用、效率、效果、先进性及适用性,选择最优技术、经济方案。

5.2制度和流程管理

运维管理制度应包括但不限于机房管理、网络与系统管理、数据和介质管理、配置管理、安全管理、监控管理、文档管理、设备和软件管理、供应商管理等制度。

运维操作流程应包括但不限于日常操作、事件处理、问题处理、系统变更、应急处置等流程。

5.3 文档管理

对运维过程中涉及的各类文档进行管理,可按照制度文档、技术文档、合同文档、审批记录、日志记录等进行分类,并妥善保存。5.3.2 对文档的版本应当进行控制。

文档在使用时应能读取、使用较新版本,防止作废文件的逾期使用。

5.4设备和软件管理

建立计算机相关设备和软件管理制度,对设备和软件的使用、安装、维修(升级)等进行规范。明确设备和软件管理责任人。对设备进行标识,标识应放在设备明显位置。

规定设备和软件的使用年限,定期进行盘点,并对设备状态进行评估和更新。

对外送设备的维修进行严格管理,防止数据泄露。

对拟下线和拟报废设备的存储介质中的全部信息进行清除或销毁。对正式下线设备和软件交指定部门统一管理、保存或处置,并保留相应记录。设备和软件报废应符合公司现行资产管理规定。

5.5供应商管理

对供应商支持运维服务的相关活动进行统一管理。

在与供应商签订的合同中明确其应承担的责任、义务,并约定服务要求和范围等内容。

应定期收集、更新供应商信息,组织对供应商的服务质量、履约情况、人员工作情况等内容进行评价,并跟踪和记录供应商改进情况。加强运维外包服务管理,主要包括:

a)明确外包公司应当承担的责任及追究方式;

b)明确界定外包人员的工作职责、活动范围、操作权限; c)对外包人员工作情况进行监督和检查,并留存相应记录; d)对驻场外包人员的入场和离场进行管理; e)定期评估外包的服务质量; f)制定外包服务意外终止的应急措施。

5.6督促检查

定期检查审计,对运维制度的执行情况和运维工作开展情况定期进行检查和审计,以督促运维工作持续改进。

指定人员负责对日常操作执行情况进行检查,确保运维管理制度和操作流程的有效执行。对检查和审计结果采取纠正、预防措施。

6.运行维护

6.1日常操作及监控分析

未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。

电脑发生故障时,使用者作简易处理仍不能排除的,应立即报告IT,非专业管理人员不得擅自拆开机箱或调换设备配件。

计算机及其相关设备的报废需经过IT 部门或专职人员鉴定,确认不符合使用要求后方可申请报废。

运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。

主要监控指标具体如下:

a)机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等;

b)网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络

延时、丢包率等;

c)主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等;

d)存储:设备运行状态、数据交换延时、存储电池状态等;

e)安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等;

6.2 数据与介质管理

配合数据应用部,对核心业务数据进行周备份,并每季度进行恢复性测试。

对设备和人员出入进行管理。进入机房应限制和监控其活动范围,并有专人陪同;未经批准不得接入生产环境。

6.3机房管理

对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。

应指定机房管理负责人。确保机房环境整洁和安全,包括:

a)应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性;

b)应保持机房环境卫生,设备摆放合理,归类; c)不得随意出入机房。

d)未经审批不得接入其它用电设备。

6.4 网络管理

确保网络、系统的正常运行。网络管理应包括: a)绘制网络拓扑图,并保持更新;

b)应保持网络设备的可用性,及时维修、更换故障设备; c)应负责网络系统的参数配置、调优; d)应定期对系统容量进行检查和评估;

e)应定期检查网络设备的用户、口令及权限设置的正确性;

f)应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态; g)应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计

算机网络跳线应整齐干净,跳线标识清晰;

h)应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。

权限管理应包括如下要求:

a)权限分配应履行审批手续,权限设置后应复核; b)应按照最小安全访问原则分配用户权限; c)应在用户账户变化时,同时变更或撤销其权限; d)应定期检查权限设置的有效性。

6.5 弱电管理

严格按图纸施工,在保证系统功能质量的前提下,提高工艺标准要求,确保施工质量。质量检查制度,现场管理人员将定期进行质量检查并贯穿到整个施工过程中。统运行验收:当设备安装完毕并调试运行无误后,由公司派现场调试人员进行系统联调,并向上级汇报调试结果。运维对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。

6.6桌面维护

日常数据注意事项:

a.个人文件(Excel、Word、PDF 等)建议员工不要存放在系统盘(通常为C 盘),可以存放在其它盘符。

b.工程师可通过多种方式或途径来告知员工如何进行日常文件的备份,如:口述、邮件、培训等。

c.未经许可,禁止使用U 盘,移动硬盘,手机或其它外设,如:网盘、邮箱等,盗取公司内部文件。

重装系统前注意事项:

a.询问用户有哪些相关数据需要备份,如桌面、我的文档、收藏夹、邮件等。b.用户Email 的备份:如客户端为Outlook 则导出相关OST 或PST 文件;硬件损坏需更换或维修时,运维人员进行测试,明确是否真实异常,不可随意更换。

关于账号、权限、密码

a.必须严格按照公司制定的IT 策略进行管理,不可私自制定规范。b.禁止私自把个人管理员权限借给他人或告知他人。

c.禁止为他人开设规定以外的权限,如:本地管理员、其他部门目录访问权限、上网权限、电话权限等。

d.更改任何类型用户权限时需得到相关审批层级确认才可执行。e.如电脑无特殊应用需求,则一律为“user”普通权限。

f.人员离职时,总部和分部应及时通过OA 确认,删除离职人员的相关账号与信息。

g.妥善保管自己所知的密码。

6.7服务器及系统变更

不得在服务器上使用带有病毒和木马的软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。

使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及木马的实时监测,及时升级病毒库。

管理员对管理员账户与口令严格保密、重要数据库,网站,APP 等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。

任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注意保护机房内的设备和物品,未经允许的非管理人员不得擅自操作机房内设备。

严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。除管理员外,任何人不得随意改动服务器内系统及环境配置。

除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取(或企图获取)超级用户权限。

6.8 配置管理

明确配置管理负责人。

建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。

定期对配置进行备份及文档库归类。

及时检查并定期审计,对发现的不一致情况及时纠正修改。

6.9 事件与问题管理

对运维事件的处理进行规范,对发生的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。

对所有事件响应、处理、结束等过程进行跟踪、监督及检查。对问题进行分析、提出解决方案,通过变更管理审批后部署实施。

7.应急管理

7.1应急准备

明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。

网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密

切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。

应急准备应符合如下要求:

a)系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件;

b)在自身力量不足以满足应急要求的情况下,应与相关供应商签署服务保障协议。协议内容应包

括双方联系人、联系方式、服务内容及范围、应急处理方式等。应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持;

c)应建立有效的应急通讯联络系统,确保信息畅通;

7.2应急处置

在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。

篇8:基于Wiki的机房运维知识管理

1.1 研究背景

在目前全球信息化大趋势下, 谁拥有了知识, 谁就拥有了竞争力, 人们通过不断的社会实践进行经验的积累, 知识是社会实践经验的升华。知识在企业竞争中, 逐渐成为第一要素, 发挥的作用越来越重要, 这构成了知识管理发展的大背景。

知识管理迅速发展时期是上世纪80年代末90年代初, 美国是知识管理的发源地, 对于知识管理, 大家比较公认的一种看法是:知识管理是通过对企业内部知识的梳理整合, 使知识发挥其价值, 帮助企业提高效率的方法和过程。知识管理的目标是:在合适的时间, 将符合要求的知识传送给最需要的人, 帮助他们做出正确的判断, 使知识发挥其应有的价值。

1.2 研究目的

通过本次研究解决我所在机房运维管理部门师传徒受旧的管理方法, 通过Wiki知识管理平台收集、整合、管理机房动力及环境运维知识资源, 使原本分散的知识内容形成数据库, 更有效的实现知识的积累、共享、交流, 使部门工作人员充分利用团队的知识力量高效完成实际工作。

通过Wiki知识管理平台可以对新员工起到培训作用, 新员工很难在较短的时间内了解其所处的环境并进入工作角色, 不知道什么知识是工作中需要的, 遇到问题需要请教时, 不知道什么人能起到帮助作用, 有了Wik知识管理平台, 可以帮助新员工很快进入工作状态。

1.3 国内外研究现状及发展趋势

从上世纪80年代初, 人们始终在对知识管理进行探究。如何高效的进行知识交流、共享、创新, 成为人们关注的核心问题, 企业的竞争力已经由失去优势的土地、资金等转向知识。

Wiki技术在知识管理方面有其独有的技术优势, 近几年开始受到人们越来越多的关注, Wiki技术的出现对知识管理的普及奠定了一定基础, Wiki具有开源、分类、协同的特点, 参与者对于Wiki可以很快上手, 不需要有太精深的计算机技术, Wiki技术使知识管理实施的可操作性增强。

2 知识管理理论

“对事物属性与联系的认识。表现为对事物的知觉、表象、概念、法则等心理形式”, 这是从哲学角度对知识进行的定义。

Harris认为知识分为三个层次, 最底层是数据层, 中间是信息层, 顶层为知识层, 人们把数据整理加工后, 数据形成有意义的信息, 信息再与积累的社会实践经验结合最终才能形成具有价值的知识, 独立的数据没有太大价值。

人们在社会实践中, 对知识的认识越来越深刻, 进而对知识从不同角度进行了分类, 通过人们在不同社会经济形态下的实践得到了对知识作用的不同认识, 从而才有了人们对知识的不同分类, 这是建立在人们对知识认识不断加深基础之上的。

知识分为应用知识、学术知识和精神知识三大类, 这是德国哲学家马克斯·舍勒 (Max Scheler) 对知识的理解和认识。

日本知识管理专家野中郁次郎提出知识转化有四种基本模式———知识的社会化 (socialization) 、外在化 (externalization) , 结合化 (combination) 以及内隐化 (internalization) , 即著名的SECI模型。

3 Wiki概述

Wiki是一种以知识库文档为中心、以共同创作为手段, 靠参与者不停地更新修改这样一种创建、积累、完善和分享知识的全新模式, 多人协作、内容逐步积累、网状知识链接是Wiki的特色。

3.1 Wiki技术具有的优势

Wiki是开源的、易于维护的, Wiki使用了简化的语法, 能够做到快速创建、存取、更改超文本页面。

Wiki是开放的、安全的, 它允许参与者任意创建、修改、删除页面, 同时它有历史版本控制, 并可随时找回先前的版本, 这使多人协作成为可能, 并且保护了数据的安全。

Wiki是可定制的, 企业使用Wiki, 可以根据工作实际需要创建自己的管理平台架构。

3.2 Media Wiki

Media Wiki是全世界著名的Wiki知识管理平台引擎, 运行在PHP+My SQL环境下, 全世界最大的Wiki项目维基百科使用的是Media Wiki, 在世界网站排名中, 前10名中, 有一个使用的就是Media Wiki, Media Wiki能够做到不断完善, 为系统升级打下了基础, 因此受到很多人喜欢。其工作原理如图。

4 系统平台结构

机房运维知识管理平台是用开源的Media Wiki搭建的平台, 参与者可以在Web基础上, 通过机房运维知识管理平台实现知识的共享、积累、交流。参与者与新入职的员工可以通过平台快速查找自己所需的知识, 指导日常工作。系统功能如图。

通过导航模块可以查看最近更改、当前事件;通过搜索模块可用快速找到自己所需知识;通过编辑、保护、讨论、历史、删除等对知识页面进行管理;通过知识库主题分类模块实现对空调、电气、消防、土建、弱电知识的管理;通过工具箱实现上传文件和后台管理功能。

系统硬件架构为在主机房放置一台服务器做为主服务器, 在容灾机房放置一台服务器做为备份服务器, 两台服务器之间可以实现数据资源共享, 当主服务器出现故障时, 备份服务器接替主服务器的业务, 从而保障业务的连续性。

5 机房运维知识管理方法

为实现机房动力及环境运维知识库统一管理, 制定如下规章制度, 主要包括《知识库文档格式标准》、《知识库问题文档提交与审核流程》、《数据库备份管理办法》。

设置知识主管1人, 知识工作者5名。知识主管由部门主任担当, 负责对知识库文档审核。知识工作者由知识库各板块负责人担当, 负责信息的整理、内容筛查、数据更新。通过知识管理组织实现对机房动力及环境运维知识管理平台有效的管理, 使知识管理平台发挥最大的价值, 正真给日常工作带来帮助。

6 结论

本文在当前信息化发展背景下, 结合Wiki自身优点, 针对机房运维知识管理进行了讨论, 并由此开发了基于Wiki的机房运维知识管理平台, 使原本分散的知识内容形成数据库, 更有效的实现知识的积累、共享、交流, 使部门工作人员充分利用团队的知识力量高效完成实际工作, 通过知识管理平台对新员工起到培训作用, 使新员工可以很快进入工作角色。

摘要:目前存在的问题是在当前知识爆炸的信息化时代, 知识已经成为第一资源要素, 通过Wiki知识管理平台收集、整合、管理机房动力及环境运维知识资源, 使原本分散的知识内容形成数据库, 更有效的实现知识的积累、共享、交流, 使部门工作人员充分利用团队的知识力量高效完成实际工作, 并对新员工起到培训作用。

关键词:Wiki,知识管理

参考文献

[1]加内什.纳塔拉詹, 桑德娅.谢卡尔著, 赵云飞译.知识管理.中国大百科全书出版社, 2002.

[2][美]保罗.S.麦耶斯主编, 蒋惠工译.知识管理与组织设计[M].珠海出版社, 2003.

[3]王伟军, 孙晶.Web2.0的研究与应用综述[J].情报科学, 2007.9.

[4]BoLeuf, WardCunningham.The Wiki Way:Quick Collaboration on the Web.Addison-Wesley Longman, 2001.03.

[5]Wagner.C.WIKI:A Technology for Conversational Knowledge Management and Group Collaboration.Communications of the Association for Information Systems2004 (13) .

[6]梁海燕, 黄艳娟.基于Blog的企业知识共享的探讨.情报探索, 2005 (1) :76-78.

[7]奉继承等.知识管理理论、技术与运营.北京, 中国经济出版社, 2006年.

上一篇:山东省近日就地源热泵空调系统等作出规定下一篇:扶贫助学捐赠活动上的讲话稿