运维监控系统考题(精选8篇)
篇1:运维监控系统考题
1、信息系统的技术要素:数据、硬件、软件、通信网络、基础设施。
(1)数据是信息系统处理的对象,是信息系统最基本的元素。数据又包括信息、知识、智慧
(2)硬件是计算机设备的总称,也叫做硬件设备,一般分为中央处理、存储器和输入、输出设备。
(3)信息系统依靠软件帮助终端用户使用计算机硬件,将数据加工转换为各类信息产品。一般软件分为基础软件和信息系统软件。
2、信息系统的影响因素:
内部因素五个:(1)战略计划(2)管理高层(3)用户需求(4)IT部门(5)现行信息化基础
外部因素六个:(1)技术(2)供应商(3)客户(4)竞争对手(5)经济环境(6)政府
3、云计算是一种按使用量计费的服务模式,包括:软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)
4、信息系统运维的目标:信息系统运维的目标是建立一个高效、灵活的信息系统运维体系,确保信息系统安全、可靠、可用、可控,进而达到IT的充分利用。(简答或者提空)
5、信息系统运维的内容:
(1)例行操作:运维提供方提供预定的例行服务,以及时获得运维对象的状态,发现并处理潜在的故障隐患
(2)响应支持:运维提供方接到需求方运维请求或故障报告后,在双方达成的服务品质协议承诺内尽快降低和消除对需求方业务的影响。
(3)优化改善:运维提供方适应需求方业务需求,通过提供调优、改进等服务,达到提高运维对象性能或管理能力的目的。
(4)咨询评估:运维提供结合需求业务需求,通过对运维对象的调研和分析,提出咨询建议或评估的方案。
6、信息系统运维的对象是运维服务的受体,主要包括基础环境、网络平台、硬件设备、基础软件、信息系统软件、数据等。
7、信息系统运维管理的主要流程:事件管理、事故管理、问题管理、配置管理、变更管理、发布管理、知识管理。
8、运维管理流程将达到以下目标:
(1)标准化:通过流程框架,构建标准的运维流程。(2)流程化:将大部分运维工作流程化,确保工作的可重复,并且这些工作都有质量的完成,提升运维工作效率。
(3)自动化:基于流程框架将事件与运维管理流程相关联,一旦被监控的系统发生性能超标或 机,会触发相关事件及事件事先定义好的流程。
9、运维管理人员的内容:
(1)明确各业务人员的任务及职权范围,尽可能确切地规定各类人员在各项业务活动中应负的责任、应做的事情、办事的方式和工作的次序。
(2)对于每一个岗位都应该有定期的检查和评价,为此对信息运维的每项工作都有一定的评价指标。
(3)要在工作中对工作人员进行培训,以便使他们的工作能力不断地提高,工作质量不断改善,提高系统的效率。
10、信息系统运维模式:自主运维模式、完全外包运维模式、混合运维模式。
11、信息系统运维的外包概念:信息系统运维外包也称为信息系统代维,是指信息系统使用单位将全部或一部分的信息系统运维服务工作,按照规定的维护服务要求,外包委托给专业公司管理。
12、信息系统设施运维的对象:基础环境、硬件、网络、基础软件等。
13、基础软件:主要包括有操作系统、数据库系统、中间件及其他的支撑系统。
14、故障诊断与修复原则:先易后难、先软后硬、先边缘后核心、先链路后设备。
15、云环境下信息系统设施运维的优势:
1)设施运维工作更加专业、敏捷 2)设施运维单机故障影响更小 3)设施运维成本更低。
16、云环境下信息系统设施运维的挑战:1)设施架构复杂度更高 2)设施故障可能造成更大范围的损失 3)运维故障处理难度更大。
17、信息系统软件运维的管理流程:P、D、C、A(P-Plan计划 ;D-Do执行;C-Check检查;A-Act处理)。
18、信息系统软件运维文档管理:(1)文档管理制度化(2)文档管理标准化、规范化(3)落实文档管理人员(4)保持文档的一致性(5)维护文档的可追踪性。
19、信息系统软件运维的日常内容:监控、预防性检查、常规操作。
20、软件缺陷一般分为四种:微小的、一般的、严重的、致命的。
21、信息系统软件缺陷状态有:(1)活动状态(问题没有解决,通过验证缺陷仍然存在)、(2)已解决状态(问题已经解决或者通过单元测试)、(3)关闭状态(经过验证后,确认缺陷不存在之后的状态)。
22、信息系统软件恢复管理流程的要点如下:(1)系统恢复申请被提出;(2)分析信息系统软件故障原因;(3)恢复安装前检查,恢复系统后测试;(4)对恢复安装过程进行跟踪,确认;
(5)系统恢复申请单、故障原因分析记录、恢复安装记录等过程文档存档。
23、数据资源运维的管理对象:数据文件、数据管理系统、存储介质。
24、数据资源运维的应急响应:
(1)制定应急故障处理预案,设立应急故障处理小组,确定详细的故障处理步骤和方法。
(2)制定灾难恢复计划,定期进行灾难演练,以防备系统崩溃和数据丢失。
(3)灾难发生后,应急故障处理小组能及时采取措施实现数据保护及系统的快速还原和恢复。
25、数据库故障及恢复一般包括事物故障(事物内部逻辑错误)、系统故障(软故障,指系统停止运行任何事情)、介质故障(硬故障,主要指外存故障)。
26、数据备份模式分为:逻辑备份、物理备份。
27、按备份过程分为:冷备份和热备份。
28、按备份策略分为:完全备份、增量备份、差异备份。
29、SRDF可提供三种工作模式:同步模式、半同步模式、自适应复制模式。
30、远程数据同步复制的实现又包括两个部分:有足够带宽的网络连接和好的数据复制管理软件。数据复制管理软件采用Veritas的Volume Replicator(VVR)。VVR采用可靠地连接和监听协议,可远程备份系统同步进行逻辑卷复制。VVR支持广域网节点间数据的同步和异步复制,支持多点的复制。Veritas的GCM软件可是实现广域网的集群管理。
31、云环境下的数据资源运维:特点(1)云计算采用分布式存储的方式来存储数据,采用冗余存储的方式来保证存储数据的可靠性。(2)云计算的数据存储技术必须具有高吞吐率和高传输率的特点。未来的发展将集中在超大规模的数据存储、数据加密和安全保证,以及继续提高I/O速率等方面。
32、云计算需要面对海量数据交互、需要高效、稳定的数据通信、存储系统支撑,还需要实现对云环境下海量数据的安全保障和有效监控。其影响主要体现在以下方面:
(1)海量数据的高可用性保障的要求;(2)云环境下数据安全保障的要求;(3)异构海量数据高效管理的要求。
33、信息系统安全包括:实体安全、运行安全、信息安全和人员安全等几个部分。
34、数据安全必须反映以下两个基本原则:最低特权;最少透露。
35、数据安全的影响因素:物理环境的威胁; 病毒与非法访问的威胁; 对数据库的错误使用与管理不到位; 数据库系统自身的安全缺陷。
36、数据加密的方法有对称密钥加密和非对称密钥加密。对称密钥加密:指双方具有共享的密匙,只有双方都知道密钥的情况下才能使用。
非对称密钥加密:也称公开密钥加密,密钥是由公开密钥和私有密钥组成的密钥对,用私有密钥进行加密,利用公开密钥可以进行解密。
37、信息系统安全组织保障的原则:一致性、全员性、连续性、主动性、有效性、正式性。
课后思考题:
1、信息系统运维外包的概念是什么?信息系统运维外包的动因是什么?
答:信息系统运维的外包概念:信息系统运维外包也称为信息系统代维,是指信息系统使用单位将全部或一部分的信息系统运维服务工作,按照规定的维护服务要求,外包委托给专业公司管理。
信息系统运维外包的动因:(1)有利于提高组织竞争力;(2)借助专业公司的管理流程和工具软件降低信息系统运维的成本;(3)提高服务质量、降低故障率;(4)降低业务部门隐性成本。
2、简述信息系统设施的故障诊断步骤与修复方法 答:
3、信息系统软件运维的管理模式有何特点? 答:
4、软件测试在信息系统软件运维中有何作用? 答:
5、常用的数据备份策略有哪些?
答:(1)完全备份(Full Backup),是指对某一时间点上的所有数据或应用进行的一个完全拷贝。
(2)增量备份(Incremental Backup)是指在一次完全备份或上一次增量备份后,以后每次的备份只需备份与前一次相比或者被修改的文件。
(3)差异备份(Differential Backup),先在某一时点进行一次完全备份,后续备份只要记录当前数据与完全备份的差异。
6、云环境下数据资源运维的特点有哪些?
答:(1)云计算采用分布式存储的方式来存储数据,采用冗余存储的方式来保证存储数据的可靠性。
(2)云计算的数据存储技术必须具有高吞吐率和高传输率的特点。未来的发展将集中在超大规模的数据存储、数据加密和安全保证,以及继续提高I/O速率等方面。
7、常见软件安全的影响因素有那些?
答:(1)操作系统的安全漏洞:输入/输出非法访问;访问控制的混乱;不完全的中介;操作系统后门;操作系统型病毒。
(2)基于Web的信息系统软件攻击(3)主要攻击方式:数据篡改;编程攻击。
8、常见数据安全的影响因素有哪些? 答:(1)物理环境的威胁;
(2)病毒与非法访问的威胁;
(3)对数据库的错误使用与管理不到位;
(4)数据库系统自身的安全缺陷。
篇2:运维监控系统考题
一、判断题(正确画√,错误画×,每小题0.5分,共20分)
1、当生产与安全发生矛盾时,应把生产放在第一位。()
2、《矿山安全法》在安全生产法律体系中属于相关法规。()
3、生产经营单位不得因从业人员对本单位安全生产工作提出批评、检举、控告或者拒绝违章指挥、强令冒险作业而降低其工资、福利等待遇或者解除与其订立的劳动合同。()
4、宪法是国家的根本法,具有最高的法律地位和法律效力。()
5、从业人员发现直接危及人身安全的紧急情况时,有权停止作业或者在采取可能的应急措施后撤离作业场所。()
6、制定《矿山安全法》的目的是为了保障矿山生产安全,防止矿山事故,保护矿山职工人身安全,促进采矿业的发展。()
7、标准规格安全标志标识底版为黄色。()
8、当掘进工作面出现透水预兆时,必须停止作业,报告调度室,立即发出警报并撤人。()
9、在煤矿井下发生瓦斯与煤尘爆炸事故后,避灾人员在撤离灾区时佩戴的自救器可根据需要随时取下。()
10、井下主要硐室和工作场所应备有灭火器材。()
11、井下工作人员必须熟悉灭火器材的使用方法和存放地点。()
12、处理采煤工作面冒顶时,首先应采取措施恢复生产,其次是抢救遇险人员。()
13、矽肺病是一种进行性疾病,患病后即使调离矽尘作业环境,病情仍会继续发展。()
14、对离岗工人不必进行职业健康检查。()
15、为防止安全监控设备发生故障时,无法实现瓦斯超限断电功能,安全监控设备必须具有故障闭锁功能。()
16、瓦斯超限声光报警、断电、掘进工作面停风后断电是矿井安全监控系统的最根本功能。()
17、安全监控设备使用单位负责安全监控设备的安装、调试和维护工作。()
18、为保证安全监控设备灵敏可靠,安全监控仪器设备必须定期调试校正,每半月至少一次。()
19、经大修的传感器,不须经计量检定合格后就可下井使用。()
20、制备矿用的原料气应选用浓度不低于99.9%的高纯度甲烷气体。()
21、甲烷的密度小于空气,一般情况下,巷道上方的甲烷浓度大于下方。()
22、甲烷传感器应垂直悬挂,距顶板不得大于200mm,距巷道侧壁不得小于300mm.()
23、在矿井监测领域,传输元件和转换元件统称为传感元件。()
24、热导式甲烷传感器适用于低浓度甲烷的检测。()
25、电化学反应是氧化反应。()
26、煤矿中检测氮气常用的方法主要有气相色谱法、电化学法和顺磁法。现在常用的是电化学法。()
27、敷设的传输电缆要与动力电缆保持0.3m以上距离。()
28、电气型仪器在维修过程中更换电气元件后,必须立即进行一次标准气校正。()
29、电气型仪器在更换传感元件后,不必送由国家援权的计量检定部门进行检定。()
30、所有通风安全监控仪器的报废必须经国家授权的计量检定部门检定后,方可确定报废。()
31、压力传感器用气压计校正,每半年一次。()
32、便携式甲烷检测报警仪应每班清理外壳上的煤尘。()
33、甲烷报警断电仪必须具有维持正常工作不小于2h的备用电源。()
34、便携式甲烷检测报警仪使用前应检查仪器电源并进行充电。()
35、有装备矿井安全监控系统的无瓦斯涌出的煤巷掘进工作面,必须装备风电闭锁装置。()
36、每7天必须使用标准气样和按产品使用说明书的要求对便携式瓦斯检测报警仪、瓦斯氧气检测仪等进行一次调校。()
37、甲烷报警断电仪在下井使用前必须在地面进行通电检查和功能试验。()
38、甲烷报警断电仪主机安装在配电点、机电硐室等距传感器不超过仪器正常工作距离,供电及安装方便的地方。()
39、最常用的有效止血方法是加压包扎止血法。()
40、口对口吹气法适合于溺水急救。()
二、单选题(选择一个正确答案,每小题1分,共40分)
41、我国煤矿安全生产方是__
A.安全第一
综合治理
B.安全第一
预防为主
综合治理
C.安全第一、以人为本
42、我国的第一部煤炭法于__起实施
A.1993年5月1日
B.1996年12月1日
43、安全生产法于__起实施,这是我国第一部规范安全生产的综合性基础法律。
A 2002年11月1日
B
2002年11月8日
44、下列选项中不属于煤矿安全“三不生产”内容的是()A 不安全不生产
B 隐患不处理不生产
C 事故原因没查清不生产
D 措施不落实不生产
45、《刑法》规定:重大责任事故罪中,强令他人违章冒险作业因而发生伤亡事故,情节特别恶劣的可以处()有期徒刑。
A
3~7
B 5年以上
C 3年以下
46、下列属于从业人员安全生产权利的是()
A 危险因素知情权
B 遵章守规
C 发现隐患及时报告
47、下列选项中,不属于《安全生产法》五项基本原则的是()
A 人身安全第一的原则
B 预防为主的原则
C 管理、装备、培训并重的原则
48、安全监测监控的作用主要是()和救援协调。
A 灾害预警
B 监视矿工
C 防止“三违”
49、从业人员对用人单位管理人员违章指挥、强令冒险作业,()。
A 不得拒绝执行
B 先服从后报告
C 有权拒绝执行 50、煤层顶板可分为伪顶、直接顶和基本顶三种类型。在采煤过程中,()是顶板管理的重要部位。
A 伪顶
B 直接顶
C 基本项
51、通常按照井筒形式不同,将矿井开拓方式分为立井开拓,斜井开拓、平硐开拓和()。
A 综合开拓 B
多水平开拓
C 单水平开拓
52、煤矿使用的涉及安全生产的产品税,必须经过安全检验并取得煤矿矿用产品()。
A 防爆标志
B 入井合格证
C 安全标志
53、在标准大气状态下,瓦斯爆炸的瓦斯浓度范围为()。A 1%~10%
B 5%~16%
C 3%~10%
D 10%~16%
54、煤与瓦斯突出多发生在()。
A 采煤工作面
B 岩巷掘进工作面
C 石门揭煤掘进工作面
55、在含爆炸性煤尘的空气中,氧气浓度低于()是,煤尘不能爆炸。
A 12%
B 15%
C 18%
56、在混合气中,当氧气浓度低于()时,瓦斯就失去爆炸的可能性。
A 18%
B17%
C 13%
D 12%
57、瓦斯爆炸的条件有3条,()爆炸。A 只要3条中的一项条件存在,瓦斯即可 B 只要3条中的两项条件存在,瓦斯即可 C 三项条件必须同时存在,瓦斯才能
58、煤尘爆炸的条件有4条,()爆炸 A 只要4条中的一项条件存在,煤尘即可 B 只要4条中的两项条件存在,煤尘即可 C 四项条件必须同时存在,煤尘才能
59、采区回风巷和采掘工作面回风巷风流中,瓦斯浓度最大允许值为()。
A 1.0%
B 0.5%
C 1.5%
D 2.0% 60、在掘进工作面或其他地点发现有透水预兆时,必须()。A停止作业,采取措施,报告矿调度室,撤离人员 B停止作业,迅速撤退,报告矿调度室 C采取措施,报告矿调度室 D停止作业,报告矿调度室
61、《职业病目录》规定的职业病为10大类()种 A 115
B 120
C 110
D 150 62、矿井监控系统主机主要用来接收监测信号、校正、报警判别、数据统计、磁盘存储、显示、声光报警、人机对话、()控制打印输出、与管理网络联接等。
A 控制
B 控制设备
C 输出控制
63、一般工业监控系统均工作在非爆炸环境中,而矿井监控系统工作在有瓦斯和煤尘爆炸性环境的煤矿井下。因此,矿井监控系统的设备必须是()电气设备。
A 本质安全型
B 一般型
C 防爆型
64、矿井监控系统宜采用()异步传输方式,也可采用()同步传输方式。
A 串行
串行
B 并行
并行
C 串行
并行 65、矿井监控系统宜采用()、调频和调相传输。A调频 B基带 C 脉冲
66、分站至主站之间、分站至分站之间的最大传输距离应不小于()km。
A 10 B 15 C 20 67、矿井监控系统应工作稳定,性能可靠,出厂前要进行连续7天的稳定性试验,系统软件死机率应小于()。
A 1次/700小时 B 1次/620小时 C 1次/720小时 68、矿井监控系统地面电源波动适应范围应为()。A 80%~110% B 70%~110% C 90%~110% 69、监控软件在完成数据运算、处理时、所带来的各种运算、处理误差应小于()。
A 1.0% B 1.5% C 0.5% 70、传感器主要由敏感元件、()、测量及交换电路和电源等组成。
A黑白元件 B 转换元件 C 输出元件 D感应电路 71、催化燃烧式甲烷传感器一般只用于检测()。
A甲烷 B高浓度甲烷 C 低浓度甲烷 D 高、低浓度甲烷
72、()式甲烷传感元件有铂丝催化元件和载体催化元件两种。
A热导 B催化燃烧 C气敏半导体 D 红外探测 73、空气中甲烷浓度低于()时,甲烷能够充分燃烧,甲烷浓度越高,载体催化元件的电阻变化就越大。
A 7.5% B 8.5% C 9.5% D 10% 74、测量电路是对检测元件输出的电信号进和加工、处理和变换,使之成为便于显示、记录、控制处理的()。
A电压信号 B非电信号 C电流信号 D标准电信号 75、馈电状态传感器用于监测被控开关负荷侧的()状态。A 断电 B 馈电 C 工作 D 漏电
76、对需经常移动的传感器、声光报警器、断电器及电缆等安全监控设备、必须由()负责按规定移动,严禁擅自停用。
A 采掘班组长 B 采掘区队长 C 机电维修工 D 安全监测工
77、凡经大修的传感器、必须经()后方可下井使用。A 通电试验合格 B计量检定合格 C校正 D 鉴定 78、催化剂升华会使置于同一气室的补偿元件载体上吸附微量催化剂,使甲烷能够在补偿元件上催化燃烧,从而使电桥输出灵敏度()。
A失效 B 增加 C不变 D下降
79、进行口对口吹气人工呼吸时,每分钟应吹气()次。A 14~16 B 60~80 C 18~21 80、进行仰卧压胸法时,每分钟约()次。
A 14~16 B 16~20 C 10~15 D 20~25
三、多项选(选择两个或两个以上正确答案,每小题2分,共40分)
81、我国煤矿多为井工开采,作业地点经常受到()、有毒有害气体和破碎顶板的威胁。
A 水
B 火
C 瓦斯
D 矿尘
E 光照不足
82、在煤矿井下,瓦斯的危害主要表现为()。
A 有毒性
B 窒息性
C爆炸性
D 导致煤炭自然发火
E 煤与瓦斯突出
83、采掘工作面或其他地点发现有()、底板鼓起或产生裂隙、出现渗水、水色发浑、有臭味等突水预兆是,必须停止作业,采取措施。
A 挂红
B挂汗
C 空气变冷
D出现雾气
E水叫 F 顶板淋水加大
G 顶板来压
84、煤尘爆炸必须具备的条件是()。
A 足够的氧气
B 煤尘本身具有爆炸性
C 煤尘达到爆炸浓度
D有足以点燃煤尘的热源
85、矿井监控系统应具有甲烷、()等模拟量监测,馈电状态、设备开停、风筒开关、风门开关、烟雾等开关量监测和累计量监测功能。
A 风速
B 压差
B一氧化碳浓度
D温度
86、矿井监控系统应具有系统设备布置图显示功能,以便及时了解(),便于管理与维修。
A 系统配置
B 运行状况
C 安设位置
D 安装数量
87、采区设计、采掘作业规程和安全技术措施,必须对安全监控设备的(),信号电缆和电源电缆的敷设,控制区域等明确规定,并绘制布置图。
A 种类
B 位置
C 数量
D 等级
88、煤矿常用的温度传感器主要有热电偶式、热电阻式、()、光纤式和热噪声型等。
A.光辐射式
B.热敏电阻式
C.感温式
D.半导体红外式
89、常用的矿井风速传感器主要有()两种。
A.超声波旋涡式
B.超声波计时式
C.感温式
D.催化燃烧式
90、安全监测工应将在籍的装置逐台建账,并认真填写()等。
A.检修校正记录
B.传感器使用管理卡片
C.故障登记表
D.设备及仪表台账
91、安全监控仪表及设备校正包括零点、()等的校正。
A.灵敏度
B报警点
C断电点
D复电点
92、开/停传感器使用中,被测设备关闭时绿灯常亮,原因可能是()。
A. 邻近带点电缆信号干扰
B.灵敏度电位器调得太大
C.绿灯坏
D.电路故障
93、便携式甲烷检测报警仪由机壳、()、电池组等主要部分组成。
A 电路板
B 连接线
C 显示器
D 传感器
94、甲烷报警断电仪必须()。
A具有甲烷超限声光报警和甲烷超限断电功能
B具有维持正常工作不小于2h的备用电源
C具有局部通风机停电、断电闭锁功能
D具有掘进工作面停风、断电闭锁功能
95、便携式甲烷检测报警仪使用前应()。
A检查仪器电源并进行充电
B在新鲜的空气中检查仪器零点
C检查仪器外壳是否固定牢固
D开机稳定后调校零点
96、甲烷报警断电仪一般由()等部分组成。
A 主机
B 接线盒
C 传输电缆
D 甲烷传感器
97、《煤矿安全规程》中规定,没有装备矿井安全监控系统的矿井的()和有瓦斯涌出的岩巷的掘进工作面,必须装备甲烷风电闭锁装置或甲烷断电仪和风电闭锁装置。
A.岩巷
B.煤巷
C.半煤岩巷
D.采煤工作面
98、经地面(),确认各项功能正确无误,甲烷报警断电仪运行稳定正常后,方可下井安装、使用。
A.调试
B.连接
C.检验
D.调校
99、甲烷报警断电仪是指对监测区域内的甲烷浓度进行(),对被控设备进行断电、闭锁和复电功能的设备。
A.检测
B.显示
C.报警
D.馈电监测 100、甲烷报警断电仪主机安装在()等距传感器不超过仪器正常工作距离,供电及安装方便的地方。
A.工作面
B.机电硐室
C.配电点
篇3:智能网络运维监控系统
目前比较流行的网络管理软件有IBM公司的Net View, HP公司的Open View, 以及Cisco公司的Cisco Works等。但这些软件以管理主干路由器为主, 或者是建立在独立厂商各自设备的基础之上, 对于我台网络结构并不能完全适用。而网络设备正常运行与否, 直接关系到发射机的播出情况, 进一步导致不良的政治后果。为了解决目前的困难, 实现一个高效的、实时的、智能的、合适的网络设备监控系统, 已经被提到了一个空前的高度上。
因此, 我台计划建设信息化IT运维管理平台, 实现对网络系统、服务器、数据库、机房环境等信息基础的设施的全程自动监控;改变以往被动的、孤立的、分散的管理模式, 主动及全面发现系统中存在的问题[1], 以流程贯穿整个运维管理过程;减少运维人员的劳动强度, 提高效率, 切实保障各业务系统可靠、稳定、高效的运行, 进一步信息化为全台的服务质量。
1 基于ICMP和SNMP协议网络运维系统设计
ICMP是 (Internet Control Message Protocol) Internet控制报文协议。它是TCP/IP协议族的一个子协议, 用于在IP主机、路由器之间传递控制消息。控制消息是指网络通不通、主机是否可达、路由是否可用等网络本身的消息[2]。本系统正是利用了“是否可达”功能来检测目标主机是否处于联网状态。
SNMP, Simple Network Management Protocol, 即简单网络管理协议[3], 是有IETF定义的一套基于SGMP (简单网关监视协议) 的网络管理协议。在SNMP为技术的网络管理系统中, 管理工作站利用SNMP进行远程监控管理网络上的所有支持这种协议的设备:如计算机工作站、终端、路由器、Hub、网络打印机等, 主要负责监视设备状态、修改设备配置、接受事件警告等。本系统正是利用了这些功能, 对网络中的设备进行各设备状态的实时监视。
本次系统开发, 结合我台实际应用, 采用SNMP及ICMP (PING) 两种方式, 实时采集网络中设备的相关数据, 比对预设阈值, 进行告警管理, 并实时保存数据等功能。由于两种协议都会一定程度上增加网络带宽, 所以系统在设计之初就提出了时间间隔的概念, 即两次执行PING和SNMP的时间间隔。
本系统的ICMP协议采用了PING方式实现。管理主机向目标主机执行一次PING命令时, 在预设的时间内没有完成本次PING, 则系统会认为管理主机与目标主机之间的链路出现了问题, 将会产生语音、文字及图像报警信息, 通知维护人员前往处理故障。表若PING成功, 表示目标主机可达, 即主机处于正常联网状态, 系统将继续执行SNMP协议相关功能。
SNMP协议在PING成功后执行, 获取相应设备的参数信息, 与预先设置的阈值进行比对, 若超出阈值, 同样的会生成语音、文字及图像的报警信息来通知维护人员。两种协议实现流程如图1所示。
2 网络运维系统结构和功能
建立网络设备监测系统[4], 实现传统的被动式故障处理方式向前瞻式管理方式的转变, 既要使网络中出现的危险和漏洞降到最低, 防范于未然;又要减轻我台面临着巨大的运维压力, 降低信息管理的难度。因此, 整个系统以事件为核心, 将IT资源监控管理系统与流程管理系统有机地整合在一起。采用统一事件管理系统, 对整个系统内的所有事件进行收集、关联分析和处理。
通过统一的管理系统对管辖范围内IT对象的运行状况和系统性能进行实时的监控, 并以类visio图形化的方式直观地展现出来。对于系统运行的异常表现及时采用文字、图形及语音的方式报警。
本网络运维系统主要是应对我台现有的网络设备, 而我台需要监测对象有:服务器、交换机、路由器、防火墙、存储设备、终端主机、UPS等终端, 所以此次系统设计也主要针对这此设备展开。根据我台维护人员历来的经验, 在故障处理过程中, 主要针对设备ICMP (PING) 延迟, 内存利用率, 硬盘利用率, CPU利用率, 网口流量, 设备持续运行时间, 会话数, 电压状态等参数信息判断网络运行情况, 所以软件功能也由此展开。图2显示出了本系统的主要监测对象及功能:
3 软件系统设计与实现
网络运维系统软件采用了微软visual stdio 2010开发平台, 使用Win SNMP API实现SNMP协议[5]及ACE网络库实现ICMP (PING) 协议, 并结合人交互较好的ribbon控件 (图3, 图4) 及类visio控件 (图5) 进行开发。现简单介绍此系统的几个功能:
3.1 系统管理模块
“开始运行”:系统从数据库中加载已保存的设备数据到类visio主视图内 (图4) , 然后启动检测线程, 执行图1所示的检测流程进行检测;
“停止运行”:用来关闭系统检测;
“系统配置”:配置软件的启动项, 报警语音, 管理系统作为服务器端时的TCP/IP配置及数据库连接字符串配置 (图6) 。
3.2 布防管理模块
“解除警报”:解除当前发生的警报事件;
“布防选中”:使选中的设备进入布防状态, 即系统将实时进行检测;
“撤防选中”:使选中设备进入撤防状态, 即检修状态, 系统将不进行检测;
“布防所有”:使所有加载的设备都进入布防状态;
“撤防所有”:使所有加载的设备都进入撤防状态;
3.3 设备管理模块
此块功能区主要功能是用来添加设备、删除设备、修改设备属性及保存数据等功能。
3.4 视图管理模块
此功能区主要功能是显示和隐藏相应的视图窗口, 用户可根据自己的需求来自定显示方案。
3.5 标题栏模块
系统运行时, 此模块 (图4) 会显示出整个系统当前运行状态:正常、异常、未启动等信息。
3.6 类visio主视图模块
此模块 (图5) 显示了当前系统所有等检测的设备, 当处于编辑状态时, 使用人员可随意在此区域增加、删除、修改元素等功能。当处于检测状态时, 以不同的颜色和图片显示出设备检测结果 (正常、异常、检修等状态) 。当鼠标移动到指定设备上时, 会显示出当前检测的结果值, 用户可以根据提示信息判断设备运行情况。
3.7 状态栏模块
显示作为服务器端TCP/IP状态, 数据库连接状态, 客户端连接数量, 当前登入用户权限及类visio控件的缩放功能;
软件日志 (图8) :显示软件运行调试日志信息;
报警日志管理 (图9) :用户操作日志信息和设备异常日志, 这些日志都保存于数据库中, 用户可根据需要进行历史查询;
3.8 选中设备历史数据查询模块
用户通过右击设备, 在弹出菜单中选中“查看历史”操作, 可以得到如图10窗口, 并可指定周期及端口号, 得到此设备指定端口和时间段的历史流量、内存利用率、CPU利用率。当鼠标进行曲线控件时, 会有显示的提示信息显示当前值, 并可对曲线图进行左右拖动查看其它结果值。
4 结束语
本系统已在我台网络机房投入使用, 网络维护人员使用后反应良好。本系统目前已实现主机是否可达及设备参数监测的功能, 但网络的自动拓扑功能还未实现, 因此, 我们下一步工作将围绕此块功能加以展开, 开发出一套更人性化的系统, 更好的为安全播出提供技术支持。
参考文献
[1]宋光慧, 魏海平.一种将主动网络技术应用于网络管理的方案[J].计算机应用, 2003.
[2]刘杰, 王清贤, 罗军勇.一种基于ICMP的逻辑层网络拓扑发现与分析方面[J].计算机应用, 2008, 6, 2 (6) .
[3]William Stallings.SNMP网络管理[M].胡成松, 汪凯, 译.北京:中国电力出版社, 2001.
[4]马瑞芳, 王会燃.基于MIB的远程监测系统信息模型的研究[J].微电子学与计算机, 2006.
篇4:运维也要被监控
因此,浙江移动迫切需要一个主动解决以上问题的方法,主动发现问题,判断故障源,并第一时间解决问题。
专家认为,要解决浙江移动面临的业务挑战,必须对业务系统等进行主动监控管理,优化关键业务服务的可用性和性能,在问题发生之前及时应对问题并解决问题; 同时通过对业务应用的监控,了解最终用户的应用体验,及时采取有效的措施,从而提升用户的满意度。
为此,浙江移动采用了业务可用性中心,可以做到全面业务的服务管理: 包括端到端应用响应时间测量、SLA (服务水平协议)监控和报告、基础架构事件管理、IT 服务依赖性视图等。尤其值得一提的是采用终端用户监控器( End User Monitor),它可以主动监控最终用户的应用体验。例如可以逐屏重放问题发生时用户的每次行为,包括用户看到的任何错误信息。这有助于应用专家利用Web 界面,快速锁定问题,及时解决。
系统从业务感知角度出发,以业务拓扑模型为核心,依据业务建模、数据聚集、告警管控和界面展示四个层次来实现IT运营管理,从而让浙江移动的业务、应用、各类平台资源等IT运营管理要素全部覆盖于系统之内。这样,浙江移动通过终端用户监控器监控网上营业厅、BOSS等系统,结果是不仅得到了综合业务视图,同时还可以得到关键性能指标(KPI)的趋势分析、历史数据展现、图表等,分析出具有代表性的客户行为报告,实现了对业务的全面监控,当然,最重要的是大大提升了客户体验。
篇5:电力系统基础考题回忆
由于本人现在没在学校,《电力系统基础》书也不在手边,所以只能凭借零星的回忆,会很不全。没有回忆考题写这些东西的习惯,不对准确性负责。
一、小题(选择题会有一两个很难的,可能我没复习到)
(1)电力系统的中性点接地方式:35KV及以下为非直接接地(中性点不接地和通过
电抗接地)、110KV及以上为直接接地;(去年好几处考了);
(2)分裂导线对电感,电容的影响(减小电感,增加电容);(也不止一个地方考了)
(3)采用分裂导线的目的:减小电晕损耗(电力系统分析里面还介绍其他好处);
(4)电能质量的衡量因素:幅值、频率、谐波(好像是);
(5)电压等级划分及其平均额定电压;
(6)最基本的理念,电压无功、频率有功等;
(7)几种短路形式的序网图连接方式;
(8)横向、纵向故障以及正、负、零序电压离短路点远近;
(9)何为电力系统短路容量(三相短路那一节有);
(10)何时三相短路是短路电流最大(过零点);
(11)电力系统基本概念,动力系统,电力网概念;
(12)正序等效定则,以及比较正负零序电抗大小的;
(13)短路冲击系数:肯定是小于2,大于1的;
(14)三种调压方式及其难易程度,那些调压范围的百分数最好记住;
(15)双向供电网络计算潮流时有无功分点不一致时如何处理(书上有);
(16)电压降落,电压偏移,电压损耗三者定义;
(17)几种调节无功的方法(记住方法名称即可);
(18)改变变压器分接头和无功补偿调压的异同,以及使用情况(是否产生无功,在无功不足或分配不均时如何使用);
(19)变压器两端的电压,哪端高10%,哪里是额定电压;
(20)最大负荷利用小时数,最大负荷损耗小时数;
二、简答题(几张卷子上的简答题很重要)
(1)电力系统负荷曲线分类及其作用;
(2)电压降落的那个图及公示;
(3)一个答案是有“再加一台变压器”的那个
(4)电压、无功曲线图并解释;
(5)降低网损措施(08级的保研面试还考了);
三、计算题
(1)电力系统调频计算,应该会涉及二次调频;
(2)电力系统等效电路计算(用平均额定电压、标幺值),并迭代法计算潮流(记得
是合起来出的);
(3)电力系统故障,正序、负序、零序,并计算。去年应该还让画了那个相量图; 有些很难的内容,譬如第四章的那些调压的,有很多公式的不太可能考大题;循环功率,特别是好多变压器的那个肯定不考的;电力系统迭代法算潮流的应该是单端供电网络,而且不会很难,主要是计算不能错。
篇6:运维系统使用情况汇报
朱贵雨
1. 运维系统简介
运维系统是专门为监控调度台定制的一套运行维护管理程序,监控调度台的日常维护、值班、交接班等各项数据的统计都可以在该运维系统上实现。
2. 运维系统使用现状
2.1.应急中心同仁在许军的指导下经过半个月的努力,都熟悉并很好的使用运维系统。经过一个月的试运行后,大家能运用运维系统把值班、交接班等日常工作中的纸质表单都体现在系统,这样更方便管理及查看,的确提高了工作效率,节省了很多宝贵的时间。
2.2.使用过程中,大家都发现很多值得改进的建议,总结后提出如下几个方面的问题:
2.2.1.软件本身的问题
A)事件管理界面无法使用,需要尽快解决;
B)创建的帐号无法删除问题;
C)所有的数据没有备份功能,需要增加自动备份功能;
D)交接班和值班记录顺序不对应;
E)添加的值班记录的数据无法修改;
F)接班人看不到交接班表。
2.2.2.需要改进的问题
A)可以开发系统点检功能模块、客户模块、会议记录模块等等,可能会更加切实到我们的工作当中;
B)运维系统的班表系统需要根据应急中心的实际需要做调整;
C)运维系统交接班的审核需要设置权限;
D)接班人接班后直接新建一个值班记录就可以,不需要接完班就自动转入值班记录中;
E)交接班表中有些不需要的功能可以取消,这样简化系统,操作方便些。F)在运维系统首页增加待办事项浮动条,这样能更容易了解需要即使处理的事情;G)运维系统服务器最好放置在机房,有稳定的服务器才能确保万无一失。
2.2.3.需要同仁改进的问题
A)交接班流程:1.值班人填写数据,2.接班人确认签字后,值班人提交《交接班表》,3.接班人确认接班;
B)建议让开发的人员过来做一次培训,虽然有文档,但是一些操作可能会导致数据丢失、平台故障等等,一旦出现解决不了就无法正常使用运维系统了
C)二线和一线目前在运维系统上还没有达成共识,很多工作没有衔接上,需要二线和一线共同商讨;
D)维护计划要及时在运维系统更新。
3. 总结
3.1运维系统优点不胜枚举,大家都有目共睹的。
3.2运维系统与工作结合还是需要大家共同努力。
篇7:运维监控系统考题
目录
运维管理规范--------------4 1.目的------------------------4 2.适用范围------------------4 3.规范性引用及参考-----4 4.本文术语,定义和缩略语---------------------------5 5.基本要求------------------6
5.1运维管理原则-----6 5.2制度和流程管理6 5.5供应商管理--------7 5.6督促检查-----------7 6.运行维护------------------8
6.1日常操作及监控分析--------------------------8 6.2 数据与介质管理-8 6.3机房管理-----------9 6.4 网络管理----------9 6.5 弱电管理---------10 6.6桌面维护----------10 6.7服务器及系统变更----------------------------11
6.8 配置管理---------12 6.9 事件与问题管理 12 7.应急管理-----------------12
7.1应急准备----------12 7.2应急处置----------13
运维管理规范
1.目的
为规范公司运维工作,使相关工作具有持续改善及相互协作性,同时加强计算机设备的管理及维护,确保维修工作的及时性,降低计算机设备的报修率,实现业务与技术的融合,将业务部门与IT 部门紧密结合在一起,根据公司管理要求及计算机应用的需要,由运维部制定。
2.适用范围
本规范规定了运维管理工作的要求。
本规范适用于维信理财集团(中国)总部,包括全国各分部及门店。
3.规范性引用及参考
◆ IT 服务管理国际标准ISO/IEC 20000 ◆ 企业获得ISO/IEC 20000认证的权威指南 ◆ 全球著名IT 服务管理书库(ITSM Library)◆ IT 服务质量管理原则
◆ 理解ISO/IEC 20000在IT 服务中的地位 ◆ ISO/IEC 20000规范和实践准则 ◆ IT 服务管理国际标准ISO/IEC 20000 ◆ GB/T 20269—2006 信息安全技术 信息系统安全管理要求
◆ ISO 31000:2009 风险管理 原则和指南(Risk management--Principles and guidelines)
◆ JR-T 0060—2010 金融信息系统安全等级保护基本要求 ◆ JR/T 0074-2012 金融IT 服务管理基本规范 ◆ 中国金融标准化报告(2011)
4.本文术语,定义和缩略语
1、IT: Information Technology 信息技术
2、DNS: Domain Name Service 域名服务
3、DHCP: Dynamic Host Configuration Protocol 动态主机配置协议
4、VPN: Virtual Private Network 虚拟专用网
5、OA: Office Automation 办公自动化系统
6、ISO: International Organization for Standardization 国际标准化组织 编订日期:30.7.2014 批准日期: 生效日期:
7、故障: IT设备或系统丧失规定的功能,导致服务中断或降质,或对正常运行造成潜在威胁。
8、异常: IT设备或系统的状态发生超出预期的变化或性能指标参数超出正常范围,有可能引发或已经引发故障,需要引起运维人员关注或处理。
9、资料: IT设备或系统的运行记录,包括IT 设备或系统的配置、故障历史记录、软硬件扩容或调整记录、权限变更申请记录等。
10、运行维护:本规范中的运行维护包括IT 基础设施维护、IT 应用系统运维维护、安全管理、网络接入、内容信息以及综合管理等。
5.基本要求
5.1运维管理原则
公司按集中与分散相结合的原则,设立机房、各部门配备电脑。计算机系统本着“总体规划、分步建设”的方式实施建立。
计算机系统建设应综合考虑成本、费用、效率、效果、先进性及适用性,选择最优技术、经济方案。
5.2制度和流程管理
运维管理制度应包括但不限于机房管理、网络与系统管理、数据和介质管理、配置管理、安全管理、监控管理、文档管理、设备和软件管理、供应商管理等制度。
运维操作流程应包括但不限于日常操作、事件处理、问题处理、系统变更、应急处置等流程。
5.3 文档管理
对运维过程中涉及的各类文档进行管理,可按照制度文档、技术文档、合同文档、审批记录、日志记录等进行分类,并妥善保存。5.3.2 对文档的版本应当进行控制。
文档在使用时应能读取、使用较新版本,防止作废文件的逾期使用。
5.4设备和软件管理
建立计算机相关设备和软件管理制度,对设备和软件的使用、安装、维修(升级)等进行规范。明确设备和软件管理责任人。对设备进行标识,标识应放在设备明显位置。
规定设备和软件的使用年限,定期进行盘点,并对设备状态进行评估和更新。
对外送设备的维修进行严格管理,防止数据泄露。
对拟下线和拟报废设备的存储介质中的全部信息进行清除或销毁。对正式下线设备和软件交指定部门统一管理、保存或处置,并保留相应记录。设备和软件报废应符合公司现行资产管理规定。
5.5供应商管理
对供应商支持运维服务的相关活动进行统一管理。
在与供应商签订的合同中明确其应承担的责任、义务,并约定服务要求和范围等内容。
应定期收集、更新供应商信息,组织对供应商的服务质量、履约情况、人员工作情况等内容进行评价,并跟踪和记录供应商改进情况。加强运维外包服务管理,主要包括:
a)明确外包公司应当承担的责任及追究方式;
b)明确界定外包人员的工作职责、活动范围、操作权限; c)对外包人员工作情况进行监督和检查,并留存相应记录; d)对驻场外包人员的入场和离场进行管理; e)定期评估外包的服务质量; f)制定外包服务意外终止的应急措施。
5.6督促检查
定期检查审计,对运维制度的执行情况和运维工作开展情况定期进行检查和审计,以督促运维工作持续改进。
指定人员负责对日常操作执行情况进行检查,确保运维管理制度和操作流程的有效执行。对检查和审计结果采取纠正、预防措施。
6.运行维护
6.1日常操作及监控分析
未经许可,任何人不得随便使用电脑及相关设备。不得更换电脑硬件和软件,拒绝使用来历不明的软件和移动设备。
电脑发生故障时,使用者作简易处理仍不能排除的,应立即报告IT,非专业管理人员不得擅自拆开机箱或调换设备配件。
计算机及其相关设备的报废需经过IT 部门或专职人员鉴定,确认不符合使用要求后方可申请报废。
运维应采取各种监控措施,配备视频、语音、系统监控和报警工具,对影响信息系统正常运行的关键对象,包括机房环境、网络、通信线路、主机、存储、数据库、核心交易业务相关的应用系统、安全设备等进行监控。
主要监控指标具体如下:
a)机房:电力状态、空调运行状态、消防设施状态、温湿度、漏水、人员及设备进出等;
b)网络与通信:设备运行状态、中央处理器使用率、通信连接状态、网络流量、核心节点间网络
延时、丢包率等;
c)主机:设备运行状态、中央处理器使用率、内存利用率、磁盘空间利用率、通信端口状态等;
d)存储:设备运行状态、数据交换延时、存储电池状态等;
e)安全设备:设备运行状态、中央处理器使用率、内存利用率、端口状态、数据流量、并发连接数、安全事件记录情况等;
6.2 数据与介质管理
配合数据应用部,对核心业务数据进行周备份,并每季度进行恢复性测试。
对设备和人员出入进行管理。进入机房应限制和监控其活动范围,并有专人陪同;未经批准不得接入生产环境。
6.3机房管理
对机房环境、供电、空调、消防、安防等基础设施的运行维护、设备和人员出入、机房工作人员等进行规范管理。
应指定机房管理负责人。确保机房环境整洁和安全,包括:
a)应定期检查防水、防雷、防火、防潮、防尘、防鼠、防静电等措施的有效性;
b)应保持机房环境卫生,设备摆放合理,归类; c)不得随意出入机房。
d)未经审批不得接入其它用电设备。
6.4 网络管理
确保网络、系统的正常运行。网络管理应包括: a)绘制网络拓扑图,并保持更新;
b)应保持网络设备的可用性,及时维修、更换故障设备; c)应负责网络系统的参数配置、调优; d)应定期对系统容量进行检查和评估;
e)应定期检查网络设备的用户、口令及权限设置的正确性;
f)应定期对整个网络连接进行检查,确保所有交换机端口处于受控状态; g)应对网络信息点进行管理,编制信息点使用表,并及时维护和更新,确保与实际情况一致。计
算机网络跳线应整齐干净,跳线标识清晰;
h)应制定网络访问控制策略,应合理设置网络隔离设施上的访问控制列表,关闭与业务无关的端口;编制文档并保持更新;访问控制策略的变更应履行审批手续。
权限管理应包括如下要求:
a)权限分配应履行审批手续,权限设置后应复核; b)应按照最小安全访问原则分配用户权限; c)应在用户账户变化时,同时变更或撤销其权限; d)应定期检查权限设置的有效性。
6.5 弱电管理
严格按图纸施工,在保证系统功能质量的前提下,提高工艺标准要求,确保施工质量。质量检查制度,现场管理人员将定期进行质量检查并贯穿到整个施工过程中。统运行验收:当设备安装完毕并调试运行无误后,由公司派现场调试人员进行系统联调,并向上级汇报调试结果。运维对弱电设备的综合管理,包括技术资料、档案的收集。同时,每月一次对弱电设备运行状况进行检查,并及时处理汇报问题。
6.6桌面维护
日常数据注意事项:
a.个人文件(Excel、Word、PDF 等)建议员工不要存放在系统盘(通常为C 盘),可以存放在其它盘符。
b.工程师可通过多种方式或途径来告知员工如何进行日常文件的备份,如:口述、邮件、培训等。
c.未经许可,禁止使用U 盘,移动硬盘,手机或其它外设,如:网盘、邮箱等,盗取公司内部文件。
重装系统前注意事项:
a.询问用户有哪些相关数据需要备份,如桌面、我的文档、收藏夹、邮件等。b.用户Email 的备份:如客户端为Outlook 则导出相关OST 或PST 文件;硬件损坏需更换或维修时,运维人员进行测试,明确是否真实异常,不可随意更换。
关于账号、权限、密码
a.必须严格按照公司制定的IT 策略进行管理,不可私自制定规范。b.禁止私自把个人管理员权限借给他人或告知他人。
c.禁止为他人开设规定以外的权限,如:本地管理员、其他部门目录访问权限、上网权限、电话权限等。
d.更改任何类型用户权限时需得到相关审批层级确认才可执行。e.如电脑无特殊应用需求,则一律为“user”普通权限。
f.人员离职时,总部和分部应及时通过OA 确认,删除离职人员的相关账号与信息。
g.妥善保管自己所知的密码。
6.7服务器及系统变更
不得在服务器上使用带有病毒和木马的软件、光盘和可移动存贮设备,使用上述设备前一定要先做好病毒检测;不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。
使用空闲主机,对服务器系统补丁进行升级测试,运行平稳后,各服务器升级安装补丁,弥补系统漏洞;为服务器系统做好病毒及木马的实时监测,及时升级病毒库。
管理员对管理员账户与口令严格保密、重要数据库,网站,APP 等服务器由研发配合定期修改密码,以保证系统安全,防止对系统的非法入侵。
任何无关人员不得擅自进入主机房,需要进入的须征得服务器管理人员同意。应注意保护机房内的设备和物品,未经允许的非管理人员不得擅自操作机房内设备。
严禁携带易燃易爆和强磁物品及其它与机房工作无关的物品进入机房,机房内严禁吸咽。除管理员外,任何人不得随意改动服务器内系统及环境配置。
除系统管理员或授权参加系统管理的人员外,任何用户不得以任何方式获取(或企图获取)超级用户权限。
6.8 配置管理
明确配置管理负责人。
建立配置文档库,对服务器、存储、网络、安全设备,操作系统、应用软件、数据库等进行管理。
定期对配置进行备份及文档库归类。
及时检查并定期审计,对发现的不一致情况及时纠正修改。
6.9 事件与问题管理
对运维事件的处理进行规范,对发生的所有事件,根据事件的影响程度和影响范围评估事件处理优先级并及时处理。
对所有事件响应、处理、结束等过程进行跟踪、监督及检查。对问题进行分析、提出解决方案,通过变更管理审批后部署实施。
7.应急管理
7.1应急准备
明确网络、系统等事件的应急指挥决策机制,负责网络与系统事件的预防预警、应急处置、报告和调查处理工作。
网络与系统应急管理应遵循“谁主管谁负责、谁运行谁负责”、“统一指挥、密
切协同;注重预防、减少风险;科学处置、及时报告;以人为本、公平优先”的原则。
应急准备应符合如下要求:
a)系统管理员、网络管理员、安全管理员等关键岗位应熟练掌握应急预案,能有效处置相关事件;
b)在自身力量不足以满足应急要求的情况下,应与相关供应商签署服务保障协议。协议内容应包
括双方联系人、联系方式、服务内容及范围、应急处理方式等。应定期检查和评估协议的执行情况,确保服务保障措施落实到位,确保在应急处置中相关单位能提供及时有效的技术支持;
c)应建立有效的应急通讯联络系统,确保信息畅通;
7.2应急处置
在发生网络与系统事件后,迅速采取应急措施,尽快恢复信息系统正常运行,如有重要情况应及时上报。
篇8:信息系统运维浅谈
关键词:运维,信息技术,信息等级保护
0 引言
运维, 是运行维护的简称, 一般是指对一个组织内部已经建成或正在建设的某一套系统 (如空调系统、电路系统、广播系统等) 中的设备、环境、软件、人员、操作等各种要素, 按照一套标准的方法流程、技术手段和制度文档进行日常的操作/维修和综合管理, 确保它们能够正常运作。针对信息系统的运维就被称为信息系统运维, 亦被简称为IT运维。
IT运维诞生于信息化建设中, 且会与之相生相伴, 共同发展。无论单位规模大小, IT运维都会经历一个“运维内容从无到有, 运维对象从单一到混合, 运维广度从简单到复杂”的成长历程。
(1) 起步阶段:台式计算机的使用标志着IT运维工作的萌芽
我国绝大部分单位的信息化建设工作开始于20世纪90年代初, 在这之前对信息化知识的了解一片空白, 对信息化的认知是从认识台式计算机开始的。当时此类设备价格不菲, 所以购买数量稀少 (一般是一到两台, 极少有超过两位数的) , 用途也较单一 (主要用于文件资料打印) 。会操作该设备的员工极其有限, 而真正了解、熟悉计算机的就更少。一般由一名兼职 (由计算机操作员兼) 或专职 (外招计算机专业人士) 的员工负责该计算机及其配套设备的日常维护工作———主要是日常使用和故障维修。此时会相应拟定一个基本的管理制度, 作为确保该计算机及其配套设备平稳运行的依据和保障。
(2) 发展阶段:应用软件的部署开启了IT运维工作的成长之路
信息技术的发展推动了信息技术知识和信息产品的推广普及, 也促进了各单位开展信息化建设的需求和愿望。于是纷纷部署单个应用软件 (采购或委托研发) 使用, 拉开了正式的信息化建设工作。
这些应用软件是对单位内部某个业务流程进行信息化改造, 涉及该流程上的所有岗位和人员, 需要使用的设备和参与的人员都有较大增加, 依靠单个人员进行日常运维管理难度较大, 也不现实。成立一个由多名信息化专业人士组成的专职信息化管理部门来负责成为必然, 这个专职部门的核心工作就是对所有部署的应用软件及其附属设备进行日常维护管理。此时的IT运维工作, 不但管理对象从台式计算机扩展到服务器及交换机等设备, 而且工作内容从单台计算机使用扩展到应用软件操作、数据存储备份、设备维修保养、操作人员管理等方面, 管理难度和广度有了质的变化。
(3) 壮大阶段:全面网络化推动着IT运维工作走向成熟
随着越来越多的应用软件推广, 单位自身的信息化建设工作得到了进一步发展, 被覆盖的部门和员工在逐渐扩大, 甚至出现相互重叠的情况。为减少重复投资, 提高工作效率, 消除信息孤岛, 实现网络化成为必然———建立一个覆盖全部业务流程的内部局域网络。
这个内部网络的建立实现了信息的自动汇聚、数据的自动流通, 促进企业生产效率和经济利益的提升。但是同时也进一步增大了IT运维管理的难度和压力———扩充了如信息安全、网络管理等诸多运维内容和对象。
1 存在的问题
经过多年的持续建设, 截至目前, 绝大部分单位均已建立了一套基本的IT运维管理规范。这套规范从制度、设备、安全、数据、人员、网络等方面指导日常的IT运维工作。运行效果总体上是良好的, 但一些具有普遍性的“通病”依然存在, 未得到较好的解决。
1.1 信息化建设投入“不足”
信息化建设是一个循序渐进的、长期发展的过程, 需要不间断的、持续的投入 (包括知识技术、专业人才、专项资金等) 。但是这种投入不会产生“直接”效益, 只能通过其他部门的“收益”来间接体现, 直观上几乎感觉不到信息化投入带来的“好处”所在, 这就在很大程度上制约了对信息化投入的积极性和主动性。同时降低管理成本的压力始终存在, 使得信息化投入滞后的情况从信息化建设伊始就一直存在且从未彻底解决, 这在一定程度上影响了对IT运维建设的投入, 也妨碍了IT运维管理水平的提高。
1.2 信息化制度建设“不足”
众所周知, “没有规矩不成方圆”。所谓规矩, 就是为确保某一个事情能做成功而制定的规定、规则、做法, 进而演变成相应的制度规章来规范管理。信息化制度就是针对信息化工作制定的“规矩”。每个单位都会制定相应的信息化管理制度, 但执行效果不太理想, 仍存以下不足:
1.2.1 信息化制度执行力方面
由于我国自古以来的“人情社会”的特殊国情, “人情大于法治”思想还普遍存在, “法规遵从”意识还未完全建立起来。加之管理体制和机制的因素 (这点在行政事业单位和国有企业中表现特别显著) , 使得制定的信息化制度在实际执行过程中效果不佳, 特别是有关IT运维管理方面的规章制度执行到位程度不高。
1.2.2 信息化制度更新方面
信息化制度涉及面很广, 内容较多, 制定过程繁琐不易。而信息化人员的能力水平和时间精力是有限的, 已经制定完成的信息化制度普遍存在“高挂上墙、无人问津”的情况。与信息化技术的新发展、信息化管理的新要求同步程度不高, 更新不及时, 甚至出现“一个制度用终身”的情况, 使得制度的“有效”性存在不小的缺陷。
1.3 运维知识分享能力“不足”
基于成本等因素考虑, 单位内部的信息化工作人员鲜有按职数要求配备齐全的, 一人兼多岗的情况很普遍。日常IT运维工作内容较多, 而个人的精力和能力是有限的, 将工作内容分割成不同块, 交由不同人员分别管理是必然的。每个人的知识水平和工作方法各有千秋, 获得的运维知识和经验也不尽相同, 将这些运维知识汇总融合不仅有助于提高IT运维工作效率, 还有利于提升IT运维整体水平。但是由于认识不到位, 以及缺乏必要的投入, 运维知识共享能力建设未能及时开展, 造成了数量众多的“知识孤岛”。
1.4 信息数据备份校验建设“不足”
信息数据包括软件系统 (操作系统和应用系统) 自身的配置数据及其运行的数据, 硬件系统 (服务器、网络设备、计算机终端等) 自身的配置数据, 以及用户的私有数据。这些数据是一笔无形的财富, 它的重要性和价值与日俱增。任何单位的信息部门都应采取必要措施保证它们 (用户自身数据一般除外) 安全。除了采取措施确保存储这些重要数据的介质安全, 一般还会购置专业备份软件 (或利用最新备份技术) 实现对这些重要数据的自动备份。
这种自动备份机制的有效性和可靠性只有通过将备份的数据进行还原才能验证, 但这项验证工作开展情况不太理想, 主要是因为备份数据需要还原到一个与现行应用系统完全一致的环境中才能进行有效性校验, 而搭建这样一个环境所需的投入 (包括软硬件成本、现场环境等) 与建设它的成本相差无几, 这不是每个单位都能承受得了的。如果同时存在多个信息系统, 一旦它们的部署环境和硬件条件不相同, 则由此产生的投入将会是极其巨大的。
2 解决之道
IT运维管理作为保障IT系统业务正常、安全、有效运行的重要工具, 担负着“IT保护伞”的重任。只有及时完善IT运维管理, 才能有效保证信息系统平稳运行、安全有效。
2.1 增加信息化投入
信息化项目从建设开始到“消亡”结束的全生命周期内都需要不停的投入, 交付前是建设投入, 交付后则是运维投入, 而运维投入一般会占整个总额的60%以上。信息化建设是一把手工程, 用通俗易懂的文字、简洁直白的语言向高层领导介绍每一个信息化项目的必要性和必需性, 让他们听懂才会得到支持。有了充足的、充分的投入才能确保日常运维的效率和效果。
2.2 抓好制度建设
一个好的制度, 不仅要体现在内容文字上, 更要反映在执行效果上, 只有真正“落地”的制度才能激励员工的工作积极性。
要使制度真正落地, 可以:一则通过培训、交流等形式宣贯制度内容, 反复“潜移默化”每位员工, 促使制度内容入心入脑, 人人熟知;再则要建立切实可行的奖惩机制, 将奖励和惩罚措施明列于制度中, 并与员工个人的业绩考核挂钩, 通过经济杠杆来促进制度的落实;最后要根据信息化发展的现状, 通过修改稿等形式实时修订各项制度条款, 使其内容体现最新要求, 文字更加严谨, 操作更加规范, 管理更加严格。
2.3 建立知识分享体系
信息化工作人员在日常进行IT运维过程中所获得的知识其实是属于单位的“财产”。但由于人的个体独立性, 使得这份“财产”是保存在员工自己身上, 如不加以集中, 则会变成员工的“私有财产”, 造成单位“资产流失”。建立一个面向全体信息化工作人员的共享知识库可以将员工“私有”的知识转变成“共有”的, 进而成为企业的“知识财富”。
2.4 完善数据管理
数据是存储在介质上的, 故而对数据的管理包括对数据本身和存储介质两方面。日常运维中既要确保数据本身在产生过程中是“干净”的、有效的、真实的, 又要确保存储介质运行状态是稳定的、正常的、安全的。而保护数据安全最有效办法就是“安全防护+数据备份”, “安全防护”是前提和基础, “数据备份”是重点和核心。
“安全防护”通过部署信息安全产品和安全防护措施可以实现, “数据备份”则需借助自动备份机制完成。对于备份的数据进行有效性校验可以采取诸如虚拟化技术等最新信息化技术来实现。
2.5 用好信息等级保护制度
信息安全等级保护制度是一项以信息安全等级保护为核心的国家制度。信息安全等级保护是指对国家秘密信息、法人和其他组织及公民的专有信息以及公开信息和存储、传输、处理这些信息的信息系统分等级实行安全保护, 对信息系统中使用的信息安全产品实行按等级管理, 对信息系统中发生的信息安全事件分等级响应、处置。
信息等级保护从技术和管理两个方面提出了具体的措施要求。技术类安全要求, 主要是通过在信息系统中部署软硬件并正确地配置其安全功能来实现。包括物理安全、网络安全、主机系统安全、应用安全和数据安全及备份恢复等几个层面。管理类安全要求, 主要是通过控制各种角色的活动, 从政策、制度、规范、流程以及记录等方面作出规定来实现。包括安全管理机构、安全管理制度、人员安全管理、系统建设管理和系统运行维护管理等几个方面。
信息等级保护制度具有国家强制性的特点, 全国所有符合条件的单位都要遵照执行。参照制度规定中的技术和管理要求, 能弥补IT运维管理中的不足, 修正IT运维管理中的错误, 完善IT运维管理中的瑕疵, 有效地提升IT运维水平及运维管理能力。
3 结束语
信息技术仍在不断的更新和发展, 各单位自身的信息化建设仍处在不断推进发展的过程中, 伴随信息化的全生命周期的IT运维的好坏, 直接影响着信息系统的运行状态, 需要高度重视。
参考文献
[1]王仰富, 刘继承.中国企业的IT治理之道[M].北京:清华大学出版社, 2010.
[2]庞南.信息安全管理教程[M].北京:中国人民公安大学出版社, 2007.
[3]荆继武.信息安全技术教程[M].北京:中国人民公安大学出版社, 2007.
【运维监控系统考题】相关文章:
监控运维技术方案05-28
关于智能交通设备运维监控系统设计与实现的分析与探讨01-24
系统运维建议范文06-03
系统运维调查问卷07-21
系统运维服务方案07-21
系统运维应急预案05-19
系统运维调查问卷06-02
监控系统05-11
系统运维经验总结汇总05-23
信息系统维护运维方案05-23