运维管理规定附件

2022-07-25

第一篇:运维管理规定附件

运维管理标准

概述

运维是管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于运维部门内部日常运营管理,涉及的对象分成两大部分,即业务系统和运维人员。其管理内容又可细分为七个子系统:

第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;

第二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复; 第

三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理 第

四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

第五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。

第一章 总则

1. 为加强公司各个项目后期的系统运维管理,确保系统能够平稳、可靠地运行,更好地为客户提供管理服务,特制定本规定。

2. 实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计好的程序进行。

3. 完善运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量。

4. 本规定适用所有进入运维环节的项目。

5. 运维人员应根据授权,处理本规定中所涉及的业务事项。

第二章 主机、服务器及数据库系统的运维管理

1. 根据应用需求,主机、服务器及数据库系统的配备和安装、以及系统资源的使用等由公司项目实施部统一规划。

2. 应指定专人作为系统管理员(系统工程师)和数据库管理员,对系统的运行、管理、维护和安全负责,并按照有关规定负责系统和数据的备份与恢复。 3. 系统/数据库管理员应定时对系统进行监控和定期的健康性检查,分析系统运行和资源使用状况,并进行必要的优化、调整和修正,及时消除隐患。如系统设置发生变化,或重新安装系统,或安装了新软件,应在此后15个工作日内对系统进行密切跟踪。

4. 及时解决处理系统运行过程中出现的异常问题和软硬件故障,并采取必要措施,最大限度地保护好系统资源和数据资源。

5. 对于重大软硬件系统故障,应立即通知部门领导,协调服务商,使系统尽快得以恢复运行;对于应用系统引发的系统异常或故障,应及时通知相关人员,并协同解决处理。

6. 每季度应对系统主机/服务器/数据库进行一次停运维护,其操作必须严格按照操作规程进行。其他非正常性停运(故障引发的除外),应提出书面申请,并经部门领导批准后方可进行。同时做好相应的准备工作,最大限度地减少对业务操作带来的影响。

7. 具有系统操作或管理权限的人员调离工作岗位或离职,应立即从系统中删除该用户;如该人员掌握超级用户口令,应立即更换口令。

第三章 软件系统的运维管理

1. 避免在用户工作时间进行软件版本升级工作,以免由于人为失误造成业务中断。 2. 软件系统的安装、升级等操作应保留完整的实施记录。

3. 对软件系统进行升级、更新补丁,应首先进行相关的测试,并在确认无误后实施。

4. 对软件系统进行升级、更新补丁,或进行系统的重新安装等操作,应在实施前对原有系统及数据进行备份。

5. 变更系统配置,修改配置文件、参数文件时,应对原始配置数据(或文件)进行保留。

6. 软件进行版本升级时,对于不影响业务的升级工作,须以书面形式详细将计划、方案、措施等报上级主管部门备案;对于影响业务的升级工作,必须提前两周向上级通信主管部门以书面形式提出申请详细报告计划、方案、措施等,经批准后方可实施。

7. 维护人员应定期跟踪所使用系统的软件升级情况和升级后的新功能,必要时提出升级建议。

第四章 数据库的运维管理

1. 对于数据库的变更必须有记录,可以回滚。 2. 无用表和字段要及时清理。

3. 从数据库删除数据一定要先备份再删除。

4. 定期对数据库数据进行自动备份,以便在故障发生后尽快恢复最新的数据。定期检查备份的执行情况,确保备份操作正确执行。 5. 指定专人定期进行备份数据的恢复性试验。

1、严格操作原则:在系统上进行可能影响系统运行的参数设置、更改和维护等操作时,须有2人以上在场进行监护和确认,并作好详细的操作记录;

2、提前沟通确认原则:软件进行版本升级时,对于不影响业务的升级工作,必须提前与客户方进行沟通,避免操作中人为失误造成业务中断;对于影响业务的升级工作,须提前与客户方进行确认,达成一致后方可实施。

3、遵守保密原则:对被运维系统单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。

第五章 巡检管理

定期了解设备的运转情况,做好系统日常运行的基础数据记录,做到有问题早发现、早解决,避免隐患,确保设备的完好率,保证系统运行质量。

1. 对硬件设备进行定期巡检,是确保系统稳定运行的重要措施,巡检工作包括例

行巡检、节假日和重要事件前的巡检

2. 维护人员应根据工作计划,对维护的设备定期进行预防性巡视检查,巡查过程中应认真负责,及时发现问题,重点注意处在恶劣环境下、存在潜在质量故障的设备,巡查要认真做记录。

3. 巡检过程中发现告警应立即进入处理流程,判定为故障的要立即进入故障处理流程

4. 所有的巡检都应有详细的记录,包括时间、巡检情况和责任人,并应在巡检纪录卡上签字。

第六章 网络管理规范

 关键业务流程

对以下业务系统流程监控,对业务系统是否正常运行、各项具体参数指标是否超标等进行掌控,避免或降低业务系统故障的发生率。

1、单位内部的关键业务流程。

2、网络吞吐量大的业务流程。

3、对系统造成大的压力,频繁使用数据库的业务流程

4、同其它系统集成的业务流程,这些集成会提高应用失败的风险。  用户体验同系统性能指标相关联

将网络中的所有网络基础架构都进行集中监测,包括对数据库服务器、应用服务器、路由器、交换机、防火墙的监控,收集网络运行信息,将性能数据同单位内部用户的体验相结合来分析网络的性能状况,诊断系统瓶颈。

 建立网络运行基准指标并观察趋势

长期监测并通过对网络运行的观察,分析网络性能的变化和流量等指标的运行趋势;及时发现网络偏离系统基准模型时的异常状况,分析故障,达到预警的目的,防止更严重问题的发生。  设计报警策略,避免警报泛滥

配置报警的依据是根据信息服务管理网的网络运维管理目标,报警设置的原则:

1、对影响网络和业务的重要指标设置报警;

2、消除误报和重复报警;

3、报警应该以多种方式及时发送给相应的负责人。  创建自动化、规范化事件处理程序

信息服务网络运维,日常处理事务较多,需要在网络、链路和系统运行出现问题时能够有自动化、规范化的处理问题程序,快速处理各种潜在故障并且分配到相应的负责人,提高工作效率。另外可将工程师长期积累的知识和工作经验系统化和固化,达到快速定位故障的目的。

 网络服务质量SLA的量化管理 提高网络服务质量的设立量化指标,将其作为整个网络运维管理团队的整体目标。信息服务管理网网络性能管理的总体目标包括网络和设备、业务的可用性、网络的吞吐量、带宽使用百分比、网络延时、CPU和MEMORY的负载,对于不同的网络指标还要根据网络的上下级连接关系分解到每一个子指标,作为对网络故障诊断和性能管理的依据。

 制定网络的升级和改进策略

网络的升级和改进应该以对现有网络和系统性能数据的测量为前提,以对网络整体运行的现状及趋势分析为依据。通过对单一网络系统和整体网络系统性能数据的比较、单一网络组件和其它网络组件的数据比较、系统负载量最大时的性能数据和一般负载时的性能数据的比较等,判断是否需要对系统的局部或者整体进行升级,发现网络系统性能的瓶颈,提出网络系统改进的方法。  日常规范

1. 每天两次进行业务系统、网络运行状况、业务流量及对外服务器服务状况监控巡查;

2. 按照规定的时段巡统计并汇总运维表单。(流量统计、事件统计、问题统计、手里投诉统计等)按照规定的时段查看路由、防火墙等关键系统运行情况,包括网络流量、带宽占用率等,重点检测关键设施,并记录;

3. 处理产品组网络问题应做完整、详细记录,快速响应,及时确定原因,积极组织处理,同时记录解决问题的操作过程,问题解决后应及时回复;

4. 对网络资源调配管理(ip资源分配、设备端口划分、链路传输、负载均衡等)、核心和汇聚层等核心网络运维的调试,做好汇报申请并记录。

5. 故障分析及处理,网络拓扑更新及网络优化。网络安全方案实施部署,更新维护录入知识库。

6. 处理各种网络故障,并作记录,保障网络正常运行。 7. 遇到不能处理的问题时,通知相关人员或及时汇报,并记录;

8. 工作人员要有强烈的安全意识,巡查时应注意发现各种可能的安全隐患并及时排除。

第七章 请示报告制度

为加强相关信息处理和反馈管理,有效的控制系统和设备的运行状态,通过规范的请示报告流程,提高运行维护的管理效率。

例行性请示报告

1. 按照规程和制度规定的周报、月报、季报和年报。 2. 系统升级、交接和重大数据变更请示报告。 3. 各类专项请示报告和合理化建议。 紧急性请示报告

1. 各种事故、严重设备故障、严重电路故障、系统运行异常等情况。 2. 各项工作中发现的严重泄密、安全性事故报告 3. 客户要求的其他紧急性报告。

第二篇:运维相关规定

关于运维需注意的问题

1、表格填写人必须有上岗证。

2、填表人、复核人和审核人不能为同一人,不能为同一人字迹。

3、表格填写必须字迹清晰,内容必须正确,真实可信。不能出现计算错误。

4、站点名称必须与国家网站上名称一致。

5、仪器型号和编号,标气瓶编号和浓度必须填写正确、完整,不能出现前后不一致现象。

6、运维记录填写错误,需要改正时,“不要涂改,要划改”再写上正确的+运维人员签名及时间。

7、对记录表中无内容可填的空白栏,应用“/”标记。备注可空。

8、任何修改都必须填表人签字,2016年8月1日后如果出现审核或复核人代修改的将严肃处理,扣除运维费用。

9、要保证表格中的各项参数的连续性。巡检记录表中的参数变化要填写进去。如:上次检查值→此次检查值。

10、比对表需按标准格式拍,分析仪用数据列表,并能看到零点和跨度时间,颗粒物需能看到流量、温度。

11、维修设备、更换备件、更换备机等需严格如实填写相应表格,不能漏填,现场更换备机需交备机更换申请表。并及时将表上传到系统软件中的“其他任务”里。

12、运维记录中临时表,如耗材更换表、检修记录表、应急表、备机更换表与周、月运维记录一起上交总站,并在此类临时表中表明仪器的品牌如:蓝盾LGH-01;如果当月或当周没有发生次上述的情况,可不交。

13、周记录表上的各检查项需符合正常范围,如超出范围请如实记录,并在异常时处理记录中将处理情况、结果写明。

14、现场两次周巡检的间隔5-9天,否则将视为运维不合格。电子档运维周巡检的周期不能超过8天。

15、现场运维人员运维工作要有连续性,分工明确,要负责任,

此次该站点周巡检工作完成后,与下一次该站点周巡检人员工作要对接好。

16、站房使用的标气等需有完整的标签和检验报告,仪表和器具需有检定证书,都应在有效期内。

17、站房线路混乱需进行整改。

18、备机统计、停电证明统计表格需按规定上交,由驻站人员按时上交。

19、总站下发的统计材料,各公司要在保证真实性的前提下,保质、保量的按照规定的时间内上交;发现胡乱填写、弄虚作假、不符合逻辑的情况,总站将严肃处理,坚决打击作假行为。

20、工控机不允许装第三方软件,尤其是QQ等有远程控制功能的软件,如有确需要可以现场安装,人员离开现场前必须卸载。

第三篇: 运维管理办法

目录

1. 2. 3. 4. 5. 6. 总则 ............................................................................................................................... 3 系统运维管理办法 ..................................................................................................... 3 数据库运维管理办法 ................................................................................................ 3 备份运维管理办法 ..................................................................................................... 4 巡检管理办法 ............................................................................................................. 5 请示报告制度 ............................................................................................................. 5

1. 总则

第1条 为了加强运行维护管理保障业务系统稳定可靠地运行,制定本运行维护基本管理办法。

第2条 实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计好的程序进行。

第3条 完善运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量。

2. 系统运维管理办法

1. 指定专人作为系统管理员,对系统的运行、管理、维护和安全负责,并按照规定负责系统和数据的备份与恢复。

2. 定时对系统进行监控和健康性检查,分析系统运行和资源使用情况,进行必要的优化、调整和修正,及时消除隐患。

3. 及时处理系统运行过程中出现的异常问题和软硬件故障,并采取必要措施,最大限度的保护好系统数据。

4. 具有系统权限人员调离工作岗位或离职,应立即修改其保管的用户密码,或删除该用户。

3. 数据库运维管理办法

1. 对数据库的变更必须有记录,并且可以回滚。 2. 无用表和字段要及时清理 3. 数据库进行修改、删除数据时要提前备份

4. 设置对数据库的自动备份,以便在发生故障时,能尽快恢复数据,并定期检查备份计划的执行情况。

5. 指定专人定期进行备份数据的恢复校验。 6. 做好数据库操作审计,以便对操作有据可查。

4. 备份运维管理办法

4.1. 目的

建立有效的数据备份和恢复机制,确保各系统备份工作按照计划正常完成,保证各应用系统的数据安全。

4.2. 备份制度

1. 正式使用的应用系统、操作系统日志、数据库系统、网络配置等信息必须定期进行有效备份且具有可复原性。

2. 备份数据必须定期、完整、真实有效的转储到永久性介质上,并且明显标识。 3. 定时检查备份文件中是否存在备份失败的记录,如果有失败记录,需要检查故障原因,并进行排除。

4. 备份计划设置要满足业务对数据安全性的要求 5. 巡检管理办法

5.1. 目的

定期了解设备的运转情况,做好系统日常运行的基础数据记录,做到有问题早发现、早解决,避免隐患,确保设备的完好率,保证系统运行质量。

5.2. 巡检基本要求

1. 对硬件设备进行定期巡检,是确保系统稳定运行的重要措施,巡检工作包括例行巡检、节假日和重要事件前的巡检

2. 维护人员应根据工作计划,对维护的设备定期进行预防性巡视检查,巡查过程中应认真负责,及时发现问题,重点注意处在恶劣环境下、存在潜在质量故障的设备,巡查要认真做记录。

3. 巡检过程中发现告警应立即进入处理流程,判定为故障的要立即进入故障处理流程

4. 所有的巡检都应有详细的记录,包括时间、巡检情况和责任人,并应在巡检纪录卡上签字。

6. 请示报告制度

6.1. 目的

为加强相关信息处理和反馈管理,有效的控制系统和设备的运行状态,通过规范的请示报告流程,提高运行维护的管理效率。 6.2. 请示汇报内容

6.2.1. 例行性请示报告

1. 按照规程和制度规定的周报、月报、季报和年报。 2. 系统升级、交接和重大数据变更请示报告。 3. 各类专项请示报告和合理化建议。

6.2.2. 紧急性请示报告

1. 各种事故、严重设备故障、严重电路故障、系统运行异常等情况。 2. 各项工作中发现的严重泄密、安全性事故报告 3. 业主要求的其他紧急性报告。

第四篇:项目运维管理

龙岗区项目运维管理

1、设备应用

1、负责对所有设备的应用操作,每季度提交每个设备的配置和存储应用情况报告、网络拓扑报告、IP分配报告,并负责对龙岗区城管局的相关工作人员进行培训;

2、对新应用的设备需求,驻场工作人员应及时提交设备配置现状及设备规划报告,以便该应用能及时实施;

3、掌握设备的运行情况,就保修期、存储空间等及时进行提醒;

4、建立相关系统软件各种故障的恢复流程及应急措施;

2、环节与设备

1、定期对机房供配电、空调、温湿度控制等设施进行检查记录

2、做好机房人员的出入、服务器的开机或关机等工作进行记录;

3、根据维护合同附件资产清单,建立服务器及网络设备的档案,形成不易破坏的醒目标识,并定期更新相关内容;

4、对资产清单所列的各种设备、线路等,做好检查维护工作,发现故障,及时报告,并安排服务联系或维修,对维修情况提交书面报告;

5、形成每日巡视制度,对机房中相关设备的告警显示、空调、UPS等实际状态进行记录。

3、 监控和安全

1、通过IT资源监控系统,对通信线路、主机、网络设备和应用软件的运行状况、网络流量、用户行为等进行监测和报警,形成记录、妥善保存并按重要性级别,定期书面报告;

2、针对网络运行日志、网络监控记录的日常维护和报警信息分析和处理工作,提出优化建议及方案;

3、定期对网络系统进行漏洞扫描,对发现的网络系统安全漏洞进行及时的修补

4、定期检查违反规定上网或其他违反网络安全策略的行为,书面报告;

5、指派专人进行核心服务器的工作压力监控,针对业务的增长定期生成主服务器的工作压力报表,并且预估业务增长对服务器压力的影响提出合理化建议;

6、指派专人进行核心数据库的工作压力监控,定期生成报告,并就改进提出合理化建议。

4、 操作系统安全

1、根据甲方业务需求和系统安全分析结果,确定系统的访问控制策略;

2、定期进行漏洞扫描,对发现的系统安全漏洞及时进行修补;

3、及时安装系统的最新补丁程序,在安装前,首先报告同意,且在测试环境中测试通过,并对重要文件进行备份后,方可实施系统补丁程序的安装;

4、所有对系统进行的维护,均需详细记录操作日志,包括重要的日常操作、运行维护记录、参数的设置和修改等内容,严禁进行未经授权的操作;

5、 备份与恢复

1、根据印制中心实际应用情况、根据生产相关数据的连接关系、根据应用的业务特点和软硬件资源,制定详细的系统数据备份计划,确定合理的系统备份策略。定期备份重要业务信息、系统数据及软件系统等;

2、应根据数据的重要性和数据对系统运行的影响,执行数据的备份,每月提交数据备份报告,必要时实施数据恢复;

3、按照控制数据备份和恢复过程的程序,对备份过程进行记录,所有文件和记录应妥善保存;

4、定期进行备份介质的维护、更新、替换、轮转,保证备份介质可靠有效,针对重要备份介质进行双机房异地轮转;

第五篇:IT运维管理

目录

定义

IT运维管理包含内容

运维员三大法则

在网络的基础设施建设完成之后,整个网络处于运行状态,IT部门采用相关的管理方法,对运行环境(包括物理网络,软硬件环境等)、业务系统等进行维护管理,我们把这种IT管理的工作简称为IT运维管理。

IT运维管理包含内容

IT运维是IT管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于IT部门内部日常运营管理,涉及的对象分成两大部分,即IT业务系统和运维人员。其管理内容又可细分为七个子系统:

第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;

第二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;第

三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素Critical Success Factors)和KPI(关键绩效指标Key Performance Indicators);

第四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

第五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。

运维员三大法则

【此法则适用GPL协议,欢迎各位自由发挥】第一法则,运维员不得危害服务器的安全运行,偷窥篡改服务上的数据,或袖手旁观服务器受到入侵;第二法则,运维员必须保护自己,除非违背第一法则;第三法则,运维员必须服从运维经理的命令,除非违背第一和第二法则。

上一篇:园务年度工作总结下一篇:语文课题研究总结