系统可用性

2024-05-06

系统可用性(精选十篇)

系统可用性 篇1

1 可用性计算方法研究

系统可用性指标综合了系统可靠性指标和系统维修性指标, 从系统可靠性角度和维修性角度检验系统的长期工作能力。在分析系统可用性指标时, 需要用到可靠性指标中的MTTF何MTBF, 以及维修性指标中的MTTR。[2]

(1) 平均工作时间 (MTTF, Mean Time To Failure) :不可修复 (指失效后无法修复或不修复而进行替换) 产品的平均寿命是指产品失效前的平均工作时间。

(2) 平均故障间隔时间 (MTBF, Mean Time Between Failures) :可修复产品的平均寿命是指相邻故障间的平均工作时间, 称为平均无故障工作时间或平均故障间隔时间。

(3) 平均修复时间 (MTTR, Mean Time To Repair) :指更换/维修故障的平均时间, 包括设备修理时间/设备更换时间和安装后调整时间。

针对平均工作时间MTTF的维修任务为更换设备, 针对平均故障间隔时间 (MTBF) 的维修任务为设备维修, 但是在系统可用性分析中并不详细讨论设备的维修过程或更换过程, 而只关心从发生故障到清除故障的操作时间。因此, 对于研究可用性与可靠性、维修性的关系, 平均工作时间 (MTTF) 和平均故障间隔时间 (MTBF) 等效。

1.1 设备可用性计算方法研究

对于航空机载设备 (LRU) 来说, 在设备发生故障 (显性或可探测隐性故障) 后, 无论故障是否可维修, 为了保证正常飞行, 首先都将设备更换。因此在计算设备可用性时, 方法较为简单, 因为平均修复时间 (MTTR) 是确定的。以下为设备可用性的计算公式:

Aitem为设备可用性指标;

MTBFitem:设备平均故障间隔时间;

MMTRitem为设备平均维修时间。

1.2 系统可用性计算方法研究

系统可用性的分析对象为多个设备, 系统内任何一个设备发生故障均会导致系统不能正常工作 (没有考虑MMEL的情况, 如果系统内包含MMEL, 则去掉MMEL项目) , 因此在计算系统可用性时, 需考虑系统内各设备的故障情况。

系统可用性的计算方法与设备可用性的计算方法相同, 所不同的是MTBF应当使用系统的MTBFsystem, MTTR应当使用系统平均MTTRaverage。

Asystem为系统可用性指标;

MTBFsystem为系统平均故障间隔时间;

MTTRaver age为系统平均修复时间。

假设系统内有n个设备:

等式 (2) 等价变换后可得:

假设在一段较长的时间范围T内, 第i个设备发生了Mi次故障, 总的修复时间为Ti。

按照定义:

在 (4) 等式右侧分子和分母同时乘以1/T:

同样, 在 (6) 等式右侧分子和分母同时乘以1/T:

等式 (7) 变形后可得:

将 (8) 带入 (5) 可得:

将 (3) 和 (9) 带入 (2) 后可得出系统可用性指标。

2 系统可用性计算

以某控制系统为例, 表1列出了该控制系统内部设备清单及相关的MTBF和MTTR。表1为控制系统可用性指标参数表。

2.1 设备可用性计算举例

以表1中设备1为例, 计算设备1的MTBF设备1为60000H。

根据维修手册, 设备1的MTTR设备1为3H, 包括更换时间和新设备的调整时间。

根据MTBF和MTTR, 设备1的可用性指标

各设备的单个设备可用性已列在表1最后一列中, 不再重复计算。

2.2 系统可用性计算

根据表1中列出的设备数量、MTBF、MTTR, 计算系统可用性过程如下:

将MTBFsystem=1562.5FH和MTTRaverage=1.67188FH带入 (1) 后可得:

通过以上计算可知, 该控制系统可用性为99.89%。

3 结语

系统可用性反映了系统的可靠性和维修性, 较高的系统可用性说明系统可靠性较高, 同时系统维修时间成本较短, 从侧面反映了系统可靠性与维修性之间的平衡。本文提供的计算系统可用性指标的方法计算过程明确、简单, 在工程应用有一定的借鉴意义。

摘要:文章介绍了广义可用性分析方法的理论基础和工作流程, 并提出了计算可用性指标的含义。本文还描述了可用性指标与安全性指标和维修性指标之间的关系。安全性指标和维修性指标是计算可用性的基础, 直接影响可用性指标的计算结果。本文在提出计算方法的同时, 以举例形式说明计算方法的可行性。

关键词:可用性,可靠性,维修性,功能持续性

参考文献

[1]Society of Automotive E ngineers, Guidelines for Development of Civil Aircraft and Systems (SAE ARP 4754A) , 2010.

系统可用性 篇2

硬件环境:

两台HP Server rp5470小型机,7110磁盘阵列

软件环境:

HP-UX B.11.11、MirrorDisk/UX B.11.11、MC / Service Guard A.11.14、Oracle9i for HP-UX。

3.1准备系统

3.1.1编辑安全文件:

[/@machine01]vi .rhosts文件

machine1 root

machine2 root

3.1.2创建根逻辑卷的镜像

[/@machine01]#pvcreate -B /dev/rdsk/c2t2d0

[/@machine01]#vgextend /dev/vg00 /dev/dsk/c2t2d0

[/@machine01]#mkboot -l /dev/rdsk/c2t2d0

[/@machine01]#lvextend -m 1 /dev/vg00/lvol1 /dev/dsk/c2t2d0

[/@machine01]#lvextend -m 1 /dev/vg00/lvol2 /dev/dsk/c2t2d0

[/@machine01]#lvextend -m 1 /dev/vg00/lvol3 /dev/dsk/c2t2d0

[/@machine01]#lvextend -m 1 /dev/vg00/secswap /dev/dsk/c2t2d0

[/@machine01]#lvextend -m 1 /dev/vg00/lvol4 /dev/dsk/c2t2d0

[/@machine01]#lvextend -m 1 /dev/vg00/lvol5 /dev/dsk/c2t2d0

[/@machine01]#lvextend -m 1 /dev/vg00/lvol6 /dev/dsk/c2t2d0

[/@machine01]#lvextend -m 1 /dev/vg00/lvol7 /dev/dsk/c2t2d0

[/@machine01]#lvextend -m 1 /dev/vg00/lvol8 /dev/dsk/c2t2d0

[/@machine01]#/usr/sbin/lvlnboot -b /dev/vg00/lvol1

[/@machine01]#/usr/sbin/lvlnboot -s /dev/vg00/lvol2

[/@machine01]#/usr/sbin/lvlnboot -r /dev/vg00/lvol3

验证镜像是否已正确创建:

[/@machine01]#lvlnboot -v

显示下列信息说明镜像已正确创建

Boot Definitions for Volume Group /dev/vg00:

Physical Volumes belonging in Root Volume Group:

/dev/dsk/c1t2d0 (0/0/1/1.2.0) -- Boot Disk

/dev/dsk/c2t2d0 (0/0/2/0.2.0) -- Boot Disk

Boot: lvol1on:/dev/dsk/c1t2d0

/dev/dsk/c2t2d0

Root: lvol3on:/dev/dsk/c1t2d0

/dev/dsk/c2t2d0

Swap: lvol2on:/dev/dsk/c1t2d0

/dev/dsk/c2t2d0

Dump: lvol2on:/dev/dsk/c1t2d0, 0

在machine02机上重复以上步骤

3.1.3创建群集锁卷组和物理卷:

[/@machine01]#pvcreate -f /dev/rdsk/c4t0d0

[/@machine01]#mkdir /dev/vglock

[/@machine01]#mknod /dev/vglock/group C 64 0x00

[/@machine01]#vgcreate /dev/vglock /dev/dsk/c4t0d0

[/@machine01]#vgexport -p -s -m /tmp/vglock.map /dev/vglock

[/@machine01]#rcp /tmp/vglock.map machine02:/tmp/.

[/@machine02]#mkdir /dev/vglock

[/@machine02]#mknod /dev/vglock/group c 64 0x020000

[/@machine02]#vgimport -s -m /tmp/vglock.map /dev/vglock

3.2用LVM创建存储基本结构:

3.2.1创建卷组:

#c4t0d1盘来自磁盘阵列,vg01用于存放oracle库ora9的数据

[/@machine01]#pvcreate -f dev/rdsk/c4t0d1

[/@machine01]#mkdir /dev/vg01

[/@machine01]#mknod /dev/vg01/group c 64 0x010000

[/@machine01]#vgcreate /dev/vg01 /dev/dsk/c4t0d1

[/@machine01]#lvcreate -L 10000 /dev/vg01

[/@machine01]#newfs -F vxfs /dev/vg01/data

[/@machine01]#mkdir /data

[/@machine01]#mount /dev/vg01/data /data

[/@machine01]#vgdisplay -v /dev/vg01 #验证卷组是否已正确创建

3.2.2将卷组分发到二号机:

[/@machine01]#umount /data

[/@machine01]#vgchange -a n /dev/vg01

[/@machine01]#vgexport -p -s -m /tmp/vg01.map /dev/vg01

[/@machine01]#rcp /tmp/vg01.map machine02:/tmp/.

[/@machine02]#mkdir /dev/vg01

[/@machine02]#mknod /dev/vg01/group c 64 0x010000

[/@machine02]#vgimport -s -m /tmp/vg01.map /dev/vg01

[/@machine02]#vgchange -a y /dev/vg01

[/@machine02]#mkdir /data

[/@machine02]#mount /dev/vg01/data /data

[/@machine02]#vgdisplay -v /dev/vg01] #验证配置

[/@machine02]#umount /data

[/@machine02]#vgchange -a n /dev/vg01

3.3建库:

3.3.1建库:

假设Oracle99i数据库软件已经安装在系统中,oracle用户及其环境变量等均已设置好:

ORACLE_BASE=/home/oracle/app

ORACLE_HOME=$ORACLE_BASE/product/9.2.0

ORACLE_SID=ora9

ORACLE_TERM=xterm

NLS_LANG=AMERICAN_AMERICA.ZHS16GBK

ORA_NLS33=$ORACLE_HOME/ocommon/nls/admin/data

LD_LIBRARY_PATH=$ORACLE_HOME/lib:/lib:/usr/lib:$ORACLE_HOME/rdbms/lib

PATH=/bin:/usr/bin:/usr/sbin:/etc:/opt/bin:/usr/clearcase/“ target=”_blank“ >ccs/bin:/usr/local/bin:$ORACLE_H

OME/bin

按如下步骤执行:

[/@machine01]#vgchange -a y vg01

[/@machine01]#mount /dev/vg01/data /data

启动XWindows,打开一个terminal窗口,在terminal窗口中执行下列命令

[/@machine01]#su - oracle

$vi .profile

DISPLAY=x.x.x.x:0.0 #改DISPLAY变量,x.x.x.x为你当前运行xwindows终端的电脑的ip地址

$exit

[/@machine01]#su - oracle

$dbca

在GUI中选Create a database――New Database――全局数据库名:ora9.world,SID:ora9――Dedicated ServerMode――Initialization Parameters,根据实际需要填参数――改变DataBase Storage画面中Controlfile、datafile、Redo Log文件位置均为/data/――Create a database并生成创建代码――最后改sys及system用户的口令――完成

3.3.2将必要的文件拷贝至二号机:

[/home/oracle/app/admin/@machine02]rcp Cr machine01:/home/oracle/app/admin/ora9 .

[/home/oracle/app/admin@machine02]#chown -R oracle:dba ora9

[/home/oracle/app/product/9.2.0/@machine02]rcp-r machine01:/home/oracle/app/product/9.2.0/dbs .

[/home/oracle/app/product/9.2.0/@machine02]chown -R oracle:dba dbs

3.4配置群集:

3.4.1生成摸板并修改

[/@machine01]#cmquerycl -v -c /etc/cmcluster/clconfig.ascii -n machine01 -n machine02

[/@machine01]#vi /etc/cmcluster/clconfig.ascii

CLUSTER_NAMEoracledb

FIRST_CLUSTER_LOCK_VG/dev/vglock

NODE_NAMEmachine01

NETWORK_INTERFACE lan2

HEARTBEAT_IP192.168.100.80

NETWORK_INTERFACE lan0

HEARTBEAT_IP192.1.1.1

FIRST_CLUSTER_LOCK_PV /dev/dsk/c4t0d0

NODE_NAMEmachine02

NETWORK_INTERFACE lan0

HEARTBEAT_IP192.1.1.2

NETWORK_INTERFACE lan2

HEARTBEAT_IP192.168.100.81

FIRST_CLUSTER_LOCK_PV /dev/dsk/c4t0d0

HEARTBEAT_INTERVAL2000000

NODE_TIMEOUT6000000

AUTO_START_TIMEOUT600000000

NETWORK_POLLING_INTERVAL2000000

MAX_CONFIGURED_PACKAGES4#最大包个数,根据实际情况确定,小于等于60

VOLUME_GROUP/dev/vg01

VOLUME_GROUP/dev/vglock

3.4.2验证群集配置:

[/@machine01]#cmcheckconf -k -v -C /etc/clconfig.ascii

3.4.3分发二进制文件:

[/@machine01]#vgchange -a y vglock #必须仅在发出cmapplyconf命令的节点上激活vglock,这样才可初始化锁磁盘

[/@machine01]#cmapplyconf -k -v -C /etc/cmcluster/clconfig.ascii

[/@machine01]#vgchange -a n vglock

3.4.4启动群集并检查群集:

[/@machine01]#cmruncl -v

[/@machine01]#cmviewcl -v

还可通过断开某节点网络、停下某节点等观察群集是否能正常切换,

3.4.5存储卷组和群集锁配置数据:

[/@machine01]#vgcfgbackup vg01

[/@machine01]#vgcfgbackup vglock

3.5配置高可用性oracle包:

3.5.1建立包目录

[/@machine01]#mkdir /etc/cmcluster/pkg_ora

3.5.2创建包配置文件并进行修改

[/@machine01]#cmmakepkg -p /etc/cmcluster/pkg_ora/pkg_ora.conf

[/@machine01]#vi /etc/cmcluster/pkg_ora/pkg_ora.conf

PACKAGE_NAMEpkg_ora

PACKAGE_TYPEFAILOVER

FAILOVER_POLICYCONFIGURED_NODE

FAILBACK_POLICYMANUAL

NODE_NAMEmachine01

NODE_NAMEmachine02

AUTO_RUNYES

LOCAL_LAN_FAILOVER_ALLOWEDYES

NODE_FAIL_FAST_ENABLEDNO

RUN_SCRIPT/etc/cmcluster/pkg_ora/pkg_ora.cntl

RUN_SCRIPT_TIMEOUTNO_TIMEOUT

HALT_SCRIPT/etc/cmcluster/pkg_ora/pkg_ora.cntl

HALT_SCRIPT_TIMEOUTNO_TIMEOUT

SERVICE_NAMEoracle_service

SERVICE_FAIL_FAST_ENABLEDNO

SERVICE_HALT_TIMEOUT300

SUBNET192.168.100.0

3.5.3创建包控制文件并进行修改

[/@machine01]#cmmakepkg -v -s /etc/cmcluster/pkg_ora/pkg_ora.cntl

[/@machine01]#vi /etc/cmcluster/pkg_ora/pkg_ora.cntl

VG[0]=”/dev/vg01“

LV[0]=”/dev/vg01/data“; FS[0]=”/data“; FS_MOUNT_OPT[0]=”-o rw“

IP[0]=”192.168.100.82“

SUBNET[0]=”192.168.100.0“

SERVICE_NAME[0]=”oracle_service“

SERVICE_CMD[0]=”/etc/cmcluster/pkg_ora/oracle9i.sh monitor“

SERVICE_RESTART[0]=”“

function customer_defined_run_cmds

{

# ADD customer defined run commands.

: # do nothing instruction, because a function must contain some command.

/etc/cmcluster/pkg_ora/oracle9i.sh start

test_return 51

}

function customer_defined_halt_cmds

{

# ADD customer defined halt commands.

: # do nothing instruction, because a function must contain some command.

/etc/cmcluster/pkg_ora/oracle9i.sh halt

test_return 52

}

3.5.4修改oracle9i脚本

[/@machine01]#vi /etc/cmcluster/pkg_ora/oracle9i.sh

SID_NAME=ora9

ORACLE_HOME=/home/oracle/app/product/9.2.0

LISTENER_NAME=LISTENER

LISTENER_PASS=

MONITOR_INTERVAL=30

PACKAGE_NAME=pkg_ora

其余部分保持原状

3.5.5验证包配置文件

[/etc/cmcluster/pkg_ora@machine01]#cmcheckconf Cv CC /etc/cmcluster/clconfig.ascii -P pkg_ora.conf

3.5.6分发包二进制文件

[/etc/cmcluster/pkg_ora@machine01]#cmapplyconf -v CC /etc/cmcluster/clconfig.ascii -P pkg_ora.conf

3.5.7修改listener.ora文件

[/home/oracle/app/product/9.2.0/@machine01]#vi listener.ora

将下列条目:

(ADDRESS_LIST =

(ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.100.80)(PORT = 1521))

192.168.100.80改为包地址192.168.100.82,其余部分不变。

3.5.8将包目录和listener.ora文件拷贝至二号机

[/etc/cmcluster@machine02]#rcp -r machine01:/etc/cmcluster/pkg_ora .

[/home/oracle/app/product/9.2.0.network/@machine02]rcp machine01:/oracle/app/product/9.2.0/network/listener.ora .

[/home/oracle/app/product/9.2.0/network/@machine02]chown oracle:dba listener.ora

3.5.9启动包并观察包是否运行正常

[/@machine01]#cmmodpkg -v -e pkg_ora#启动包

[/@machine01]#cmviewcl -v#观察包及群集是否运行正常

还可通过sqlplus及OEM等oracle实用程序验证oracle包是否运行正常。

系统可用性 篇3

关键词:双重冗余;PLC控制系统;应用;优势

前言

双重冗余PLC控制系统是信息技术、机械技术以及电子技术等多方面的学科相互渗透、相互融合结果,由此来说,双重冗余PLC控制系统是一门综合性很强的技术成果,随着双重冗余PLC控制系统在各领域大型设备的广泛应用,进一步使各领域的企业生产效率和科技化水平得到了提高,大幅度的增加了企业综合竞争能力,但是由于中国在生产方面的双重冗余PLC控制系统研究起步比较晚,与国际水平还具有着相当的差距,导致双重冗余PLC控制系统的研究探讨与应用体系不够完善,是阻挡现今国内生产企业发展的主要问题。

1.双重冗余PLC控制系统的重要意义

随着工业制造水平的不断提高以及工业规模的不断扩大,更多的应用领域对生产可靠性提出了更多的要求,在实际工业生产过程中,由于生产环境以及控制对象的不统一性,导致工程的状况更加具有复杂性,在一些方面上,人为的因素也能够对控制系统产生一定的影响,进而使得系统无法保证长时间稳定持续的运行。另外,想要通过无限制提高系统软硬件本身可靠性的办法,而令整个系统满足正常运行的需要也是不现实的,基于这种情况,就要对双重冗余PLC控制系统展开利用[1]。

2.PLC冗余控制在大型设备上的应用和优势

2.1PLC冗余控制技术在大型设备上的应用

(1)PLC冗余技术在莱钢RH精炼炉中的应用

在莱钢RH精炼炉的网络系统中包括管理级和基础级网络。在基础级包含有一个工程站、两台相互冗余的服务器以及两台客户端,其中服务器为双网卡,PLC冗余控制系统与一个网卡进行数据交换,另一个网卡则是与客户端进行实时相互通讯,这样一来不仅保证了通讯的可靠性,又保证了系统之间具有相应的隔离安全性。

(2)PLC冗余技术在多晶硅还原炉电源系统中的应用

在多晶硅还原炉电源系统中,系统主站应用的是先进的冗余S7-400H系统。该产品是一种具有冗余设计的容错型自动化系统产品。在故障发生时,冗余热备功能能够在不停机的基础上自动切换到备用单元,保证了系统工作的持久不中断性能[2]。

(3)PLC冗余技术在空压机上的应用

为了保证空压机控制系统的可靠性,在空压机控制系统的设计方案上加入了冗余设计方案,控制系統的冗余方式包括I/O冗余、中央处理器冗余以及通讯冗余。其中中央处理器冗余能够保证在主处理器失效后,备用处理器能够自动的接管控制并维持运行。

2.2PLC冗余控制技术在大型设备上的优势

PLC冗余控制技术在工业的大型设备控制中占有非常重要的地位,由于我国拥有较多的工业化企业,可以根据企业设备的大小使用PLC冗余控制技术对大型设备进行调动,包括控制主站系统和远动装置,是用来对整个设备运行状态进行监控的。继而保证PLC冗余控制技术人员能够通观全局,把握施工生产过程中可能出现的问题,有效地对其进行避免,并且有效地指挥大型设备的稳定性、安全性以及可靠性运行,这样一来就能够对大型设备进行较为全面的分析和研究,然后为控制处理中心提供的设备控制处理的相应应对措施,进而将整个系统发生意外时所带来的不必要的经济损失降到最低[3]。

工业化设备运行的平稳、安全以及可靠是企业发展的重要保障,所以对工业大型设备进行在线监控、系统保护以及控制等措施是必不可少的,但是由于社会经济的不断发展,科学技术的不断进步,工业化的大型设备也逐渐增多,并且这些大型设备与主控制台之间的通讯方式也越来越复杂,为了确保工业大型设备的安全运行,国家以及企业都投入了大量的人力物力和资金,将双重冗余PLC控制技术引入到了工业大型设备控制之中,应用全微机化设备代替了原有的常规电磁式控制设备,应用计算机光缆或者电缆作为了控制信号电缆,使得生产控制中心对工业生产大型设备的控制变得快速而又安全。所以双重冗余PLC控制系统也成为了企业建设发展过程中的重要组成部分,进而保证了工业大型设备的自动化调控模式的高效性,因此对双重冗余PLC控制技术的继续研究与创新是我国发展过程中必不可少的战略性任务。

3.结论

双重冗余PLC控制技术的性能提高以及双重冗余PLC控制系统的应用是现今社会所关注的热点之一,由于这项技术的应用能够将企业生产的可靠性大幅度提高,所以也得到了国家的足够重视。双重冗余PLC控制系统的应用和工业社会是相互促进的,由于这种关系的存在,双重冗余PLC控制系统的应用对于工业社会的有着非常重要的促进作用,我国的双重冗余PLC控制技术虽然在很短的时间内取得了相当大的进步,但也不可避免的存在着一些不足,如果想要社会的工业得到大幅度的发展,就需要在双重冗余PLC控制技术方面做出更大的努力。

参考文献:

[1]冯立,王良勇,钱晓龙.冗余控制系统的原理及性能优化[J].仪器仪表学报,2011(04):334-336.

[2]严敏等.PLC的双CPU冗余控制实现[J].“A-B 世纪杯”集成构架产品应用论文集,2011(1):78-81.

系统可用性 篇4

得益于科学技术的进步,医疗器械在设计、安全性等方面都得到了长足的发展,医疗器械产品日益精艺。医疗机构不断引入常规和非常规医疗器械产品参加诊疗,对医疗器械的依赖程度愈来愈高[1]。在重视医疗器械技术创新的同时,由于对人、环境等因素考虑的不足,导致出现了不少与医疗器械相关的可用性问题[2]。在技术飞速发展的今天,如何使日益复杂的医疗器械真正满足用户需求、方便易用且带来愉悦享受,是医疗及医疗器械发展面临的一大阻碍。

评估医疗器械可用性以及为医疗器械提供有效的可用性评估方法是当前国内外热门的研究课题。拥有好的可用性是人们对于医疗器械迫切的要求。美国医疗器械设计大奖赛的评审们认为,器械的可用性一直都在得奖产品中占有重要的地位[3]。

1 原理及方法

1.1 研究对象

本次研究将测试3款品牌输液泵的临床可用性,记为品牌1、品牌2、品牌3。之所以选择这三款输液泵,一方面,这三种泵在该医院的临床中使用比较普遍,输液泵很容易获得,评估的结果具有实际应用意义和价值;另一方面,品牌1、2是进口型输液泵,品牌3是国产型输液泵,品牌2和品牌3输液泵在功能和外型上比较接近,因此,本次实验能起到对比进口和进口、进口和国产的产品在可用性方面的性能差异。

研究对象是该院ICU护士。他们长年从事临床一线工作,经常要操作输液泵,且这3种输液泵在这家医院的ICU中使用很普遍,他们基本上对这3种输液泵都很熟悉。品牌1,随机调查了17名护士;品牌2,随机调查了17名护士;品牌3,随机调查了16名护士。

1.2 原理

可用性是指产品在特定使用环境下为特定用户用于特定用途时所具有的有效性(Effectiveness)、效率(Efficiency)和用户主观满意度(Satisfaction)[4]。系统可用性量表(System Usability Scale,SUS)由John Brooke于1986年提出[5],是一种用于可用性测试的简易问卷调查量表,已广泛运用于产品的可用性评估中。SUS共10个题,采用李克特5分式量表法,其中1、3、5、7、9为正向题,2、4、6、8、10为反向题,10个问题之间具有高度的相关性[6],用来对产品进行总体评估,SUS分数越高代表产品可用性越好。该方法实施起来简单且有效。

John Brooke认为SUS方法快速却粗糙[5],但是最近有研究指出,该方法不但功能多样、简洁、可广泛使用,而且在快速的同时,也保持有准确性[7]。同时有研究指出,SUS在研究小样本量时也具有很好的可靠性[8]。本次研究将利用SUS方法,对输液泵的临床使用的可用性进行研究。

1.3 SUS量表制作及打分方式

根据经典的John Brooke制定的SUS调查表[5]以及其他学者[6,9]的研究建议,针对本次所做调查内容,制作问卷调查表10个问题如下:

Q1.我认为我会喜欢并愿意经常使用该输液泵;

Q2.我认为该输液泵没有必要这么复杂;

Q3.我认为该输液泵很容易使用;

Q4.我觉得需要有经验的人来帮助我才能使用该输液泵;

Q5.我认为该输液泵的不同功能得到了很好的整合;

Q6.我认为该输液泵有很多不一致的地方;

Q7.我觉得多数人都可以很快学会使用该输液泵;

Q8.我发现该输液泵使用起来非常笨拙;

Q9.使用该输液泵过程中,我感觉很自信;

Q10.在使用该输液泵前,我需要学习很多东西。

SUS打分规则如下[5]:

(1)每个问题根据程度设定有基础分值1~5分,对应“非常不同意”到“非常同意”;

(2)1、3、5、7、9用选项对应分数减去1即为该题分数,2、4、6、8、10用5减去选项分数即为该题分数;

(3)将10个题目分数相加,即为该问卷总得分,总得分乘以2.5即为该问卷SUS得分,SUS是百分制分数。

2 结果与分析

2.1 基本统计分析

调查结束后,按前述打分方法对所有问卷进行了初步打分,然后汇总每种输液泵所有问卷的统计结果,进行平均计算,求得各输液泵平均10个问题得分、平均总得分,以及平均SUS得分情况,见表1。

三种输液泵SUS得分,品牌1分数68.09最高,其可用性也最好;品牌2分数61.32其次,可用性表现居三者之中;品牌3分数58.44最低,可用性也最低。结合文献[6,9,10]中关于SUS分数的解释,当产品分数大于70分时,产品达到“好”(GOOD)的水平,分数大于50为“良”(OK)的水平。因此只有品牌1达到可用性“好”的水平。

有研究[5]指出,SUS量表中的10个问题,同时考察了可用性指标中的可使用性(Usable)和可学习性(Learnable)两个方面,题目1、2、3、5、6、7、8、9考察的是可使用性,题目4、10考察的是可学习性。将表1中1、2、3、5、6、7、8、9题分数相加,得到该输液泵可使用性分数,将4、10题分数相加,得到该输液泵可学习性分数。三种输液泵可使用性与可学习性对比情况见图1。在可使用性上,品牌1最好,品牌2其次,品牌3最差,这与总体可用性排序相同。在可学习性上,三者差别不是很大,品牌1比其他两款稍好,品牌3在这方面表现的比品牌2要好。

2.2 SPSS统计分析

三种输液泵所有问卷SUS分数如表2所示。为了查看临床护士对三种输液泵的看法,即三种输液泵的可用性是否有差异,是否具有统计学意义,利用SPSS 13.0版本软件对表2数据进行ANOVA分析,结果见表3、4。

如表3所示,三种输液泵SUS分数经过方差分析,P值为0.030<0.05,具有显著差异和统计学意义,可以说对于临床护士来讲,三种输液泵可用性确实具有明显差异。

如表4所示,将三种输液泵SUS分数进行多重比较分析,分析发现,品牌1与品牌3的分数具有显著差异;品牌1与品牌2在P值等于0.05的水平下不具有显著差异,在P值等于0.1的水平下具有显著差异,因此,两者之间确实具有一定差异性;品牌2与品牌3不具有差异性,没有统计学意义,两者可用性没有明显区别。

3 结论

通过SUS分析,品牌1输液泵在临床使用可用性方面要优于其他两款。这说明在护士的临床使用感受上,品牌1输液泵可能更受临床工作者的青睐,护士更乐于使用。经过SPSS统计学分析,品牌2和品牌3两款输液泵在可用性得分上没有显著差异,虽然品牌2的SUS得分比品牌3的SUS得分高一点,但是两者可用性同属“良”,这说明国产的品牌3在可用性上已经不输同类型的国外品牌2,国产的医疗器械的设计生产水平确已得到提高。

可用性作为产品的一个核心竞争力已经受到越来越多企业的关注和重视。在国际化进程飞速发展的今天,各国优秀企业不再满足产品在本地市场的投放。国际公司投放在中国的产品是否注重产品本地化直接影响到产品的销量和满意度;同样,进入海外市场的中国公司由于忽略了当地用户的研究导致产品缺乏竞争力[11]。有研究者认为,国内的医疗器械之所以在质量上与国外相当,价格也优,仍然不如国外医疗器械受欢迎的原因是对医疗器械的可用性研究比较少[12]。

医疗机构临床医学工程部门应联合临床使用者,加强对可用性的理解,积极运用可用性及其评估方法,尽可能的规避因可用性缺乏造成的风险,提高医疗器械使用安全。

摘要:目的 评估三款输液泵的临床可用性。方法 采用系统可用性量表(SUS),调查临床护士对输液泵的使用评价。结果 三种输液泵可用性具有差异(P<0.05),品牌1可用性优于品牌2与品牌3,品牌2与品牌3可用性无明显差异。结论 SUS可以有效地用于输液泵的临床可用性评估中。

关键词:医疗器械,可用性,可用性评估,系统可用性量表,输液泵

参考文献

[1]刘歆.医疗器械设计中的可用性及标准要求[J].中国医疗器械杂志,2010,34(1):47-49.

[2]刘正捷.可用性工程-开发用户满意的产品[DB/OL].(2012-06-25)[2011-09-05].Http://wenku.baidu.com/view/8fbd8f2b3169a4517723a3e6.html.

[3]猜想:公元2027年医疗器械会是个什么样[EB/OL].(2012-06-25)[2009-12-28].Http://health.sohu.com/20071228/n254363074.shtml.

[4]ISO standards:Standards in usability and user-centred design—ISO 9241-11(1998)guidance in usability[S].

[5]Brooke J.SUS:a"quick and dirty"usability scale.Usabilityevaluation in industry[M].London:Taylor and Francis,1996.

[6]Lewis J,Sauro J.The factor structure of the system usability scale:human entered design[M].Berlin:Springer,2009,94-103.

[7]Sauro J.Measuring usability with the system usability scale(SUS)[DB/OL].(2012-06-25)[2011-05-08].Http://www.measuringusability.com/sus.php.

[8]Thomas S T,Jacqueline N S.A comparison of questionnaires forassessing website usability[C].In:UPA 2004 Presentation.

[9]Bangor A,Kortum P T,Miller J T.An empirical evaluation ofthe system usability scale[J].International Journal of Human-Computer Interaction,2008,24(6):574-594.

[10]Bangor A,Kortum P T,Miller J T.Determining what individualSUS scores mean:adding an adjective rating scale[J].Journal ofUsability Studies,2009,4(3):114-123.

[11]UPA中国.高质量可用性研究在全球化市场中的重要作用及其实现[EB/OL].(2012-06-25)[2010-01-14].Http://c.chinavisual.com/2010/01/14/c64463/index.shtml.

信息系统在质控中的实用性论文 篇5

LIS系统报警提示出现检验危急值后,审核人员就要利用LIS系统实施检验科“三级播报”系统平台进行报告。利用网络上报、短信平台、电话语音提醒及时的向患者发送临床检验危机值。危急值报告完毕,LIS会自动生成危急值汇总表,通过LIS的查询功能,可以总结分析危急值的科室分布、危急值的数据。

2与电子病历对接

通过LIS与医院信息系统(HIS)的连接可实现检验科与临床科室的信息共享,通过LIS与HIS的无缝连接,临床医嘱和检验目等信息可直观的通过LIS显示,减少了差错和信息核对时间,同时临床上也能通过HIS快捷查询到患者的检验结果。对检验人员而言,通过LIS与HIS了解患者的临床资料,这样有利于更及时地发出准确的报告,并能向临床提供相关建议。存储的患者结果数据和档案信息可随时检索查询。计算机可以完全复制存档的检验结果,除了实施检测时的测量不确定度,还包括为某项检验最初指定的生物参考区间,检验结果所附的任何警示、脚注或解释性备注。检验人员、临床科室可以“在线”检索患者和实验室数据。

3检验报告自助打印平台

传统的取单模式需要患者姓名或ID号到检验科窗口查找预先打印的报告单,这样既容易造成标本与检验报告单交叉污染等原因造成院内感染,又不能很好地保护患者的隐私。而自助取报告平台的投入使用后,患者可以根据采样回执单上指定时间,自己只能打印本人的检验报告单,排除了排队的烦恼,保护了患者隐私,使患者在最短的时间里拿到自己的检验报告单,尽快实现临床诊疗。同时这也减轻了检验工作的劳动负担,提高了工作效率。标本后处理功能利用LIS标本后处理功能记录已测试标本存放信息,包括存放架号、位置号、冰箱等。自动判断每个标本需存放时间,标本处理功能能识别存放时间提示需要处理的标本信息。通过条码号查询需要重新从后处理冰箱找出的条码试管的位置信息,可通过反向定位迅速找到标本,对从后处理模块取的标本再存放登记的功能。

4讨论

随着检验医学的快速发展和临床医学对疾病的诊断和治疗越来越依赖医学实验室检验,对临床医学检验的质量要求也越来越高。检验分析的质量保证主要由分析前、分析中、分析后的质量保证组成,而检验分析后质量保证作为检验分析的最后环节,保证检验分析后质量保证成为临床实验室质量管理的重要内容,也是ISO15189实验室质量体系的重要要求[5]。检验科学的不断发展,检验理念随之变化,我们不但要做临床的好“参谋”,还要提高检验的服务质量作为检验分析后质量保证的重要内容。这就要求检验科做好结果的审核并打印报告,做好与临床的沟通,做好患者的服务解析、咨询、投诉反馈信息,做好检验后血液标本的保管和相关处理为溯源性提供依据。大型三甲医院及其ISO15189对临床实验室的要求下,检验科实验室信息系统在检验后的质量保证是实验室质量保证的重要内容,利用实验室信息系统结果审核提示功能、未检测结果提示功能、危机值的三级播报、与电子病历对接、检验报告自助打印平台、标本后处理功能等功能实现检验分析后的质量控制。有关报道[6-7]介绍检验分析前、分析中LIS的使用价值,着重介绍了LIS在临床检验科的应用,而结果审核、报告打印、危机值发送、与临床医患沟通等是检验分析后的重要内容,利用LIS系统实现检验分析后质量控制是当前检验科需要解决的重要问题。基于杭州创业公司的LIS实验室信息系统,检验科实现了检验分析后质量控制的信息化管理。结果审核提示功能能防止实验结果漏项目、结果异常与临床不符、当次血型结果与历史结果不符、危机值的发送不符合相关要求,有效地杜绝了发错结果的现象,保证了临床检验质量。未检测结果提示功能在规定时间内可以提醒检验人员对逼近实验回报时间的标本进行及时处理。

开拓性的系统 实用性的规律 篇6

因此,可以说,我国的音乐艺术或声乐艺术,虽然几千年来比较发达,但其理性的研究和分析则一直赶不上实践的步伐。当郑茂平先生有志于要写一部《声乐语音学》时,他首先意识到了这一点,他要做的事,就是开拓进取,让声乐的语言艺术能有一个更系统的规律可循。显然,这实在不是一件容易的事。但通读这部《声乐语音学》,给人的感觉是从容不迫、顺风行船,文字叙述澄澈鲜明。

郑茂平先生能有底气完成这部著作,在于他能在承传前人和同道的基础上,对声乐语音学的源流和发展有清澈的了解。尤为可贵的是,对不足看得仔细,看得分明,总结起来是:少,意识程度不够;窄,整体感觉不明;散,体系观念不强。于是,他对症下药、迎难而上。功夫不负苦心人,终于有了这部沉甸甸的《声乐语音学》。通读全书,我感觉到有几个比较显著的特点:

一是具有开拓性。学术之境界,上焉者创造突破,开拓革新;中焉者集人之长,成己之言;下焉者人云亦云,不知所云。郑茂平先生的《声乐语音学》是目前我国第一部以此命名的学术专著,它标志着声乐艺术的语音构成有了独立的理论结构,为我国的声乐学科建设开拓了新的领域,并初步奠定了相应的理论基础。

这部著作的开创性,我认为主要体现在它将声乐艺术和语音学有机地结合起来。声乐,大家很熟悉,指的是用人声演唱的音乐形式。语音学是语言学的一个分支,主要研究语言的发音机制,语音特性和在言谈中的变化规律。声乐作为一种“音乐化了的语言艺术”,是人类语音一种特殊形式。这本书将语音学的基本概念引入声乐学,全面深入地探讨了语音的性质(包括物理性质、生理性质、心理性质)和歌唱的关系,语音之辅音、元音、音节与歌唱的关系,并详细地分析了助词、轻声、儿化的音变对歌唱的影响。此外还特别针对母语汉语的特点,阐述了汉语语音声调、语气、语势对歌唱的作用。应该说,通过作者的努力,声乐语音学这门学科是立起来了。

这部书的开创性,不仅表现在整体上,也表现在局部上,其中最突出的是两点。其一,从运动中把握声乐艺术的规律。本书第五章《歌唱中语音的运动形态和过程》专门探讨这个问题。声乐是一种“活的艺术品”,不是一种凝固和静止的艺术。作者对语音的运动状态进行了深入分析,包括语音的运动状态与语义的关系、与气息的关系、与旋律的关系,从而从整体上加深了人们对声乐语音的了解。这一工作具有显著的开拓性。其二,对比分析了世界各主要语种的语音系统和歌唱特点。大家或许都听过意大利语歌曲《我的太阳》,俄罗斯歌曲《三套车》,前者的华丽、后者的忧伤总让人难以忘怀。是什么造就了各不同语种歌唱的鲜明特色呢?只要读读郑茂平这部书,就会豁然开朗。

二是系统性强。无规矩不成方圆,无系统不成理论。我以为,看一部理论专著是否具有系统性,导语或第一章往往是个试金石,最见功夫。是否提纲挈领,总揽全局?是否胸有成竹,思辨透彻?本书的第一章映入眼帘即给人以深刻印象,其能从宏观入手,总揽声乐语音学的学科性质和学科体系。什么是声乐语音学?声乐语音学的学科特点是什么?理论基础又是什么?声乐语音学的源流和发展又怎样?这些关键的概念和定义被一一厘清,起到了为全书导航,给读者指路的作用。

全书的系统性,当然更体现在它能深入全面探讨影响歌唱艺术的语音诸要素,从物理学、生理学、心理学的角度揭示歌唱与语音的内在关系。第二、三、四、五章全面展开,分析声乐语音的性质、要素、语调、语气、语势以及语音音变、运动形态与歌唱的关系,可谓层层剥笋。第六、七、八章由中而外,从比较语音学的角度研究意大利语、俄语、德语、法语的语音系统及其歌唱特点,娓娓道来,引人入胜。

三是具有实用性。此书并不是一部置身于象牙之塔、让人望而生畏的学术著作,而是一部为声乐艺术教育服务的教程。正如作者所声明的,是一部“既有理论探讨,又兼顾实证研究;在重视艺术理论价值的同时,又注重声乐表演和教学的实用价值,是声乐理论和教学领域具有开拓性的学科著作。”此书的实用性并没有刻意追求,但处处能体现出来。例如,本书论述语音在提高歌唱艺术审美中的重要作用,既为歌唱艺术中声音的运动、变化状态和过程注入了语音学和心理学的理论依据,又同时给声乐教师在语音训练和实践上提供了丰富的教学内容。又如,全书后半部分对比分析中外语音特点,既显示了作者宽广的学术视野,同时也扩大了教程的教学使用范围。

本书的语言通俗易懂,平易流畅,做到了深入浅出。此外,每章结束均设计有富有针对性和启发引导性的思考题,这些都大大增强了全书的可读性和实用性。

看似寻常最奇崛,成如容易却艰辛。我不知道郑茂平先生究竟花了多少时间和精力来成就他的这本著作。但我从他的人生履历即可知他对音乐教育的孜孜努力和不懈追求。这位70后的巴蜀青年,从1995年到2006年10余年时间,完成了从音乐学士到博士的三级跳。但他并不满足于欣赏和感受音乐的神奇之美,而是执意要破解这美的秘密。于是,他艰难跋涉,试图穿过混沌和黑暗的盲区,走向澄澈和光明的地带。他的这部拓荒之作,我相信能使更多的人以全新的感觉和理念去看待音乐。对于我而言,我似乎第一次真正理解了罗马尼亚音乐家乔治·艾奈斯库那句话的含义:音乐是一种语言,它能确切反映个人和人民的精神品质。

徐立翔 湖南理工学院音乐系副教授

系统可用性 篇7

1 安全仪表系统安全失效定性分析

安全仪表系统在生产过程中起着重要的监督作用, 如果其出现失效的问题, 就会严重干扰到生产的质量。人们在实践中对安全仪表系统的失效的认知为, 安全仪表系统的失效就是指安全仪表功能出现误动作, 并不指代任何的一种非危险失效。安全仪表系统的可用性失效也可以指代的是安全失效, 在对安全仪表系统安全失效进行定性分析的过程中, 可以从以下几个方面入手:

1.1 冗余表决结构

要想能够有效的保障安全仪表系统的可用性, 就需要针对系统的结构进行优化设计, 可以将传感器、逻辑控制器和执行器分别到冗余表决结构中, 使得冗余表决结构可以呈现出不同的结构特性和功能。由于每种结构中都含有不同的结构构成条件, 这也就决定了冗余表决结构本身所具有的安全性和可用性也会有所不同, 一些表决结构能够在安全性要求较高的情况下得到更为充分的利用, 而一些表决结构则相对于更适用于可用性要求较高的条件。但是这种适用性也是存在一定的反作用, 虽然在安全性要求较高的情况下, 一些表决结构能够得到利用, 但是其出现安全失效的几率也会大大增加。除此之外, 由于冗余系统在发展的过程中, 其系统结构更加的庞杂, 系统中的很多部件都会相应的出现安全失效的问题, 系统中出现误动作的几率会大大提升, 安全仪表系统的可用性将被降低。

1.2 共因失效

一般来说, 安全仪表系统中, 往往会设置相应的冗余结构, 而冗余结构的存在就是导致共因失效发生的主要因素之一。一旦安全仪表系统出现共因失效的问题, 就会使得安全仪表系统中的相应部件、设备等出现严重的危险, 最终会导致这些部件以及设备等出现安全失效的问题。所以, 需要综合考虑到共因失效的影响因素, 在对影响因素做到全面把控的基础上, 合理的构建安全仪表系统, 以减低其出现误动作的概率。而就安全性和可用性这两方面来说, 由于要求性质的不同, 安全仪表系统的结构要求也会有所不同, 这就决定了造成安全失效和共因失效的因素也会有所不同。相对来说, 造成共因失效的影响因素较多, 这就决定了共因失效的定量比较也具有明显的复杂性。

1.3 检测到的安全失效

通过诊断测试发现的SIS硬件安全失效可以立刻得到修复并恢复运行, 平均恢复时间包括检测失效的时间、开始维修之前已过去的时间、维修的有效时间和设备进入运行前的时问, 即新版IEC61508中的平均修复时间MTTR。检测到的安全失效λsd。大小及其平均恢复时间直接影响安全仪表系统的安全失效概率值。

2 安全仪表系统的安全失效的定量评估

根据上述分析可以了解到, 造成安全仪表系统出现安全失效的影响因素有很多, 在对这些因素进行分析的基础上, 构建安全仪表系统安全失效模型, 在保障安全失效与危险失效因素相等的情况下, 也就不需要对造成表决结构的各种修正因素进行区分。

2.1 常用表决结构安全失效概率计算模型

2.1.1 1ool结构。

1ool结构由单一设备构成, 只有一个通道。如果该通道发生检测到的或未检测到的安全失效, 则SIS将发生误动作, SIS重启时间为SD。1ool结构的PFS可靠性框图如图1所示。

2.1.2 1002结构。

1002表决结构有两个通道, 可靠性较高。如果该结构任一通道发生安全失效λsd或λsd, 则会造成SIS误动作, SIS重启时间为SD。两个通道还会因共因失效而同时失效, 从而导致SIS误动作。

2002结构表决结构有两个通道, 可用性较高。如该结构任一通道发生安全失效λsd如或λsu, 系统将降级为1ool结构继续运行, 不影响SIS的可用性;如果该结构两个通道同时发生独立的安全失效, 则SIS将误动作;另外, 两个通道还会因为共因失效而同时失效, 从而导致SIS误动作。SIS重启时间为SD。

2.1.3 2003结构。

2003表决结构有3个通道, 可同时提高系统的可靠性和可用性, 是实践中经常采用的结构。如果该结构任一个通道发生安全失效, 则系统会降级至loo2结构继续运行, 不影响SIS系统的可用性;如果该结构任意两个通道同时发生安全失效, 则SIS发生误动作;如果该结构3个通道同时发生安全失效, 则SIS发生误动作。该结构任意两个通道同时发生安全失效分为以下两种情况: (1) 任意两个通道由于检测到的或未检测到的共因失效而同时失效, 从而导致SIS误动作; (2) 任意两个通道同时发生独立的安全失效。

2.2 系统整体安全失效概率的综合定量模型

同理, 一个安全仪表系统的整体安全失效概率是由传感器、逻辑控制器和执行机构3个子系统的安全失效概率构成。

结束语

综上所述, 造成安全仪表系统出现安全失效的因素有很多, 要想能够有效的保障安全仪表系统可以得到充分的利用, 就需要在对安全失效影响因素做到充分的定量分析的基础上, 采用合理的框架图法, 来构建可用性以及可靠性较强的安全仪表系统安全失效定量模型, 并依据此模型进行对安全仪表系统的可用性进行定量分析, 以保障生产经济效益可以平稳的提升。

参考文献

[1]曹宇, 王建林, 肖家麒, 于涛.便携式安全仪表系统功能测试仪的研制[J].计算机测量与控制, 2011 (12) .

[2]杨海兵, 王健.安全仪表系统的结构约束分析[J].可编程控制器与工厂自动化, 2011 (11) .

服务可用性监控系统的设计与实现 篇8

随着计算机技术与人们生活的紧密结合, 在许多类似金融服务系统、飞行控制系统、医疗系统等应用领域, 人们对这些系统的要求是不间断的提供有保障的服务, 因为这些服务系统的故障会造成灾难性的后果。高可用性的服务解决方案就是为了解决这样的需求, 高可用性系统相比普通的计算机系统来说, 复杂性高了很多, 其对应的研发成本也高了很多。

对于高可用性系统[1]来说, 该系统的用户会在系统设计之前, 对系统的设计者提出一些量化标准, 比如, 要求该系统在一个时间范围内宕机的时间被控制在一定的范围内, 高可用性系统由于其较高的设计难度, 如果能在系统的运行期间引入量化分析的方法, 就可以有效的对其可用性进行预测及报警, 所以一个可用性监控系统对于一些大型系统的故障预测及报警有着非常重要的意义。

1 相关知识及研究

1.1 高可用性的定义

对于高可用性[2]的研究中, 有三个相关的术语, 分别是可用性[3] (Availability) 、可靠性[4] (Reliability) 以及适用性[5] (Serviceability) 。其中可用性是指对于用户的使用来说, 系统总的可用时间与总时间的百分比;可靠性是指系统在不出故障的情况下持续正常工作的时间;适用性是指对于系统维护、升级的难易程度。

在服务系统的运行周期中, 系统的可靠性通过平均无故障时间 (MTTF) 来表示, 平均无故障时间是指系统正常运行的平均时间;系统的适用性通过平均修复时间 (MTTR) 来表示, 平均修复时间是指从系统发成故障到修复完成并重新恢复的平均时间。通过平均无故障时间和平均修复时间可以得到可用性的定义:

从可用性定义的公式可以得出两个影响系统可用性的因素, 分别是:

(1) 系统各组件的可靠性。这些组件包括服务器硬件、操作系统和服务系统本身, 以及其他的支持组件如数据库系统、网络服务器等。

(2) 当系统发生故障后, 系统重新恢复所花费的时间。如果是服务系统本身的故障, 则将该系统重新启动就可以恢复服务了;如果是硬件设施发生故障的话, 则需要对定位发生故障的组件并对其进行修复或更换, 然后重新启动操作系统和其他相关设备, 最终启动服务系统。

一个高可用性系统对系统中所有的组件及子系统都要求其正常工作。在一个系统中, 如果大部分组件都具备高可用性, 但是另一些组件不具备高可用性, 对于整个系统来说, 系统也无法保证高可用性, 这个特点是高可用性系统的木桶原理[6]。

在一个高可用性系统中, 还有两个相关的术语, 即持续可用性[7] (Continuous Availability) 、容错[8] (Fault Tolerance) 。持续可用性是指系统无故障提供服务的理想状态, 其也用来表示一个系统的可用性很高, 故障时间较少;容错是指即使某些组件出现故障, 整个系统依旧可以无故障的提供服务, 一些高可用性的解决方案已经提供了一定的容错能力。

1.2 高可用性等级

高可用性等级[9]的分级是以可用性百分比中数字“9”的个数来区分的, 如果一个系统达到二级高可用, 则说明该系统的可用性百分比为99%, 一年中总的故障时间为3.65 天;如果一个系统达到四级可用, 则说明该系统的可用性百分比为99.99%, 一年中总的故障时间为52.5 分钟。可用性分级表[10]如下表:

1.3 服务可用性监控系统相关研究

国内外已经有了许多关于服务可用性分析的研究与设计, 例如一些成熟的商用服务可用性监控系统, 如IBM Tivoli、HP Buiness Availability Center等, 这些商业系统对服务可用性的分析基于强大的监控和数据分析能力[11], 对部署于其上的服务进行实时的监控, 并对不满足可用性的服务进行报警, 但是这些服务可用性监控系统的购买费用较高, 且需要大量监控日志数据的支持[12], 对于国内的一些论文作者的。

我们的目标是建立一个可靠、灵活的服务可用性监控系统, 通过在服务可用性监控系统中部署业务系统, 可以通过系统直观的看出该业务系统在某段时间内的服务可用性。

2 服务可用性监控系统架构的分析与设计

本服务可用性监控系统提供了简单的域名监控接入方式, 采用主动拉取数据的方式, 无需用户参与, 并提供了统一的可用性计算公式, 以及丰富的图表及历史数据查询对比。

2.1 服务可用性监控系统的整体架构

本服务可用性监控系统主要分为汇聚计算、统一数据管理、数据采集、数据抽样四个模块。

其中, 汇聚计算模块是本服务可用性监控系统的入口, 本模块负责接收用户的查询参数、获取统一数据数据管理模块传来的监控数据, 并对监控数据进行汇聚计算, 以得到可用性数据。如果最终计算的可用性数据低于用户配置的报警阀值时, 对用户进行报警通知。

统一数据管理模块是本系统的中枢, 本模块负责收集用户输入的监控配置项 (包括被监控服务的域名、正常服务的关键字、可用性报警阀值等) , 将其保存到数据库中, 并将监控配置项发送到数据采集模块;当用户点击其配置的监控配置项时, 系统将会根据其配置从数据仓库中找到匹配的监控数据, 并将监控数据发送至汇聚计算模块, 最终展示给用户。

数据采集模块是本系统的核心, 本模块首先取到监控配置项, 然后根据监控配置项中的数据, 调用监控集群中的多个监控机定时地对监控目标进行监控, 得到监控的数据与用户配置的数据进行对比, 如果数据不一致, 则认为当前监控的服务是不可用的, 将同一时间点多个监控机的数据累计计算出一个百分比, 并将这个数据发送到统一数据管理模块。

数据抽样模块是一个辅助模块, 主要是由于监控的数据量较大, 当计算跨月或者季度的可用性时, 由于数据量过大, 会导致计算的时间过长, 从而影响用户体验。因此, 数据抽样模块将会按天为粒度将监控数据计算出来并保存到数据仓库中。

整体流程及架构如下图:

2.2 监控数据采集

监控数据的采集是由数据采集模块完成的, 数据采集模块会根据用户配置的监控项调用监控集群中的多个监控机以10 秒一次的频率对监控目标进行监控, 将同一时间点多个监控机的数据累计计算出一个百分比, 该百分比就是当前监控项当前时间点的监控数据。具体的监控数据采集流程如下:

(1) 数据采集模块获取配置的监控项中被监控服务的域名、关键字等监控项。

(2) 监控机发起对被监控服务域名的访问, 获取其返回数据并将其返回数据与关键字对比, 如果关键字符合则计数加一, 不符合则不增加计数。

(3) 最终将多个监控机计数除以监控机的总个数得到一个百分比, 该百分比作为当前时间点的监控数据。

(4) 将监控数据按照时间和监控项ID作为主键存入数据仓库的普通表。

2.3 监控数据抽样

由于监控机的监控周期为10 秒, 对于一个服务的监控数据量会非常庞大, 当对该服务的可用性进行计算的时候会造成查询时间过长, 影响用户体验。所以, 数据抽样模块会以天为单位对服务的监控数据进行抽样计算, 并将其存入数据仓库中。具体流程为, 将前一天凌晨到当天凌晨的该被监控服务的监控数据计数并加和, 将该计数和加和作为抽样数据存入数据仓库的抽样表。

2.4 可用性计算

被监控服务的可用性计算分为两种情况:

(1) 用户查询时间区间在一天内。这种情况的可用性计算相对简单, 即统一数据管理模块通过接口查询数据仓库, 将该时间区间内所有该服务的监控数据取出, 对其进行计数和加和, 然后将该加和除以该计数就可以得到当前时间区间服务的可用性数值了。

(2) 用户查询时间区间超过一天。在这种情况中, 对总体可用性的计算由于需要的数据量过于庞大, 需要使用抽样数据。首先将查询时间区间中整天的数据从数据仓库的抽样表中取出并累加到一起, 最终得到一个计数count和一个加和sum, 然后在数据仓库的普通表中取出查询时间区间的非整天数据, 接着将查询时间区间中非整天的数据累加到sum上, 并每次对count加一, 最终得到整体计数和整体加和, 然后用整体加和除以整体计数, 得到当前时间区间服务的可用性数值。

服务可用性监控系统的数据流图如下:

3 结论

本文提出的服务可用性监控系统架构, 包括了汇聚计算、统一数据管理、数据采集、数据抽样四个模块, 一方面采用了分层的思想对业务逻辑进行分析, 降低了模块与模块之间的耦合性, 当逻辑需要发生变化的时候, 只需要修改一个模块, 不会影响到其他模块;另一方面在存储数据时, 对原始数据存储时进行了一定的数据抽样, 从而在大数据量查询时可以有效的降低查询时延, 提升了用户体验。本文的下一步研究重点是完成对除web服务以外, 其他类型服务监控的接入, 希望最终实现一个可接入多类型服务的服务可用性监控系统。

参考文献

[1]宫剑, 黄杰, 孙晓静.上海财经大学:搭建一个优良的业务监控系统[J].中国教育网络.2013 (12) :70-73.

[2]孙莉, 李洋, 李继云.基于CEP的分布式IT资源监控事件关联方案[J].计算机应用与软件.2013 (08) :302-306.

[3]刘权.基于CMDB的网管系统业务可用性监控平台的设计与实现[J].电信工程技术与标准化.2012 (10) :29-32.

[4]罗海滨, 范玉顺, 吴澄.工作流技术综述[J].软件学报.2000 (07) :899-907.

[5]李洋.基于复杂事件处理的系统监控事件关联的研究与实现[D].上海:东华大学2013.

[6]朱燕.面向连接和无连接网络的统一管理信息模型[D].北京:北京邮电大学2011.

[7]曾林青.IT网络资源管理模型及其在事件关联性分析中的应用[D].北京:北京邮电大学2008.

[8]马杰.资源监控系统中事件关联分析的研究[D].北京:北京邮电大学2006.

[9]刘文博.业务可用性监控的模型设计与分析[J].软件, 2014, 35 (4) :49-52.

[10]路永召, 王柏.一种改进的域名服务器监控系统[J].软件, 2012, 33 (12) :238-241.

[11]朱娜娜.Hadoop平台的集群故障监控的研究与实现[J].软件, 2013, 34 (12) :73-77.

系统可用性 篇9

系统的可用性指系统在投运后能够正常工作的时间占总的时间的百分比。一个简单的计算公式如下:A=MTBF/(MTBF+MTTR)。A是指可用百分比;MTBF最长修复时间;MTTR平均故障间隔时间。

表1描述了在各个可用百分比下系统的故障时间。对于一个完整的系统,无疑可用性是越高越好。但是更高的可用性将引起系统投资的增加。系统的使用者需要在可用性与系统投资之间权衡以获得适合自己的可用性比。电力监控系统项目中对于火电厂,水电厂及变电站都需要上位软件系统监视全厂设备的运行情况。各种可用性技术将能够依据自身的情况特点选择应用在上位软件系统中。

2 备份技术

备份系统是保持系统可用性的基本手段之一。在电力系统中备份的对象一般为历史数据,操作记录,故障报警记录等内容。备份量最大的是实时数据的备份。备份软件可以使用自主研发的软件,也可以使用商用软件进行备份。为了更好地实施系统的备份,需要考虑系统的备份策略。

2.1 完全备份

完全备份是将所有需要保存的内容存成一个完整的文档。完全备份一般需要花费较长的时间和较多的资源。

2.2 增量备份

增量备份指的是差异备份,在一个完全备份的基础上,对一段时间内系统所做的改变进行一个备份。增量备份相比完全备份通常花费较少的时间与资源。

2.3 备份窗口

备份窗口是指系统受到备份影响的一段时间。过去备份窗口用来表明在备份进行时系统不可用的时间长度。而现在,在进行备份的同时系统仍可以运行,如不对备份窗口进行防范,很可能对系统性能造成影响。

2.4 热备份

热备份是实现0备份窗口的最终目标。在数据库热备份过程中,数据库进行一个状态,即数据写入锁定状态,使得数据无法写入真实数据库而只写入日志文件中。当备份结束时,日志文件中的内容成批地添加至数据库中。使用此方式近似可以将备份对性能的影响降至最低。

电力监控系统中的备份策略一般采用增量备份,目的是节约备份介质并且还要尽可能地缩短备份窗口。

3 RAID技术

RAID技术是将一组独立的磁盘组合在一起进行管理,以便实现某一级的磁盘冗余。RAID共定义了五个级别,另外还有一个松散定义的级别,它不提供任何冗余。RAID的功能性可以在磁盘阵列内部或磁盘控制器上实现,也可以在主机系统上使用软件实现。使用RAID技术可以降低硬盘出错引起可用性降低的情况。

RAID0将写入磁盘中的每块数据分成更小的片段, 将其写入不同的磁场盘中,这种方式提高了系统写磁盘的性能,但这种方式也,这降低了磁盘的MTBF,使得RAID0技术降低了整个磁盘系统的可用性,所以这种方式不适宜使用。

RAID1技术将写入磁盘中的每个字节百分百地拷贝到另外一个磁盘上,这个磁盘也叫镜像磁盘。这种情况下如果一块磁盘失效,镜像磁盘可以不间断地运行,这种方法可以提高系统的可用性。虽然增加了磁盘投资,但在存储成本不断降低的今天还是值得推广使用的。

RAID3 4 5这三种技术对磁盘上存储的内容增加了奇偶校验,使得在磁盘的部分受到损坏之后能够根据奇偶校验恢复损坏部分的数据。他们之间的不同在于奇偶校验的位置不同。RAID3中建立了虚拟磁盘块,这些块被一块块地分布到RAID3卷的所有磁盘上。对于RAID3卷的每个写操作都涉及到所有的磁盘。RAID4中有一个专门的磁盘用于RAID卷的奇偶校验。对于每个写操作都涉及到写目标磁盘和奇偶校验磁盘。对于RAID5卷没有一个独立的奇偶校验磁盘,其奇偶空间一条条地分布于RAID陈列的所有磁盘上。

从上述三种RAID卷的描述分析,最简单而有效的RAID技术是RAID1镜像技术。实施成本最低廉有效。

4 网络技术

在电力系统中一般的网络系统结构如图1所示。

根据多年的运行统计分析,来自网络的故障一般有如下几种: (1) 网络接口故障:主要是指网络接口卡引起的故障原因。 (2) 网线故障:网线是联接网络中各设备的主要通路,其意外破损会导致网络的局部失效。 (3) 路由器及集线器故障:路由器及集线器是网络的中转站,其失效有可能导致整个网络的瘫痪。 (4) 网络系统的服务故障:网络系统的服务通常指网络操作系统中网络层的故障,网络层的服务通常有DNS, ICMP等内容。 (5) 延迟故障:当网速降低或大量丢失IP包时,表示整个网络的可用性降低,这也是一种网络故障。

电力系统中为了保证网络的可用性通常使用双网的办法来增加网络的可靠性。具体的方法是使用双网卡,双网线,双集线器等网络联接设备杜绝由于网络部件的失效影响网络的可靠性。使用这一方法要求应用程序能在一套网络设备发生故障时能够迅速切换到备用网络上,同时向网络维护人员警告网络故障。

5 故障转移技术

当主机系统故障发生时,理想的处理方法是能够将服务转到另外的主机上,使系统服务能够持续不断地运行下去。电力监控系统中通常设有数据库服务器,对于大型电站,服务器担当非常重要的系统作用。应最大限度保证其服务的时间。进行故障转移的一般方法是使用双服务器结构,运行方式有主-从与主-主两种方式。主-从故障转移的系统结构如图2。

主从故障转移是基本的集群系统结构,在主从结构中有一个主服务器,主服务器在正常情况下提供双节点的全部关键服务,经两条心跳网络线与从服务器及磁盘装置相联。主从服务器都与双主机磁盘装置相联,磁盘系统通常具有两个独立的控制器和磁盘。数据可从一个控制器到另一个控制器进行镜像存储。一台服务器一次只能访问一个特定的磁盘或文件系统。其访问权限由集群软件来决定。系统当主服务器因故障停止工作时,备用服务器经心跳线检测到后将接管主服务器的全部服务。在正常状态下备用服务器不向系统提供网络应用服务。

对于主主结构,其硬件及网络结构与主从结构类似,但主主结构中两台主机都运行关键服务程序,每个主机在提供应用服务的同时也为对方提供备用功能。当一台主机系统由于故障而停运时另一台主机系统接管其相应的服务。

综合上述两种结构,在当今硬件成本不断降低的今天使用主从结构是一种方便简单的主机备用方式。

6 结论

可用性技术是一项系统工程,需要软件,硬件与工程管理的三方配合才能获得满意的系统可用性。电力监控系统部门要在总结多年的运行经验基础上,还需要在技术和管理上多作努力才能保证电力系统持续稳定地发展。

参考文献

[1]Evan Marcus著, 汪青青译.高可用性系统设计[M].清华大学出版社, 2005.

[2]翟永昌, 李永丽.变电站自动化系统中基于CAN总线的数据通信[J].电力系统及其自动化学报, 2003, (05) .

系统可用性 篇10

医院信息管理系统 (HospitalInformation System HIS) 是医院重要的医疗信息基础设施, HIS系统以大型数据库系统为基础平台, 由门诊挂号管理系统、医疗诊治系统、住院管理系统、医疗科研系统以及OA系统等构成。

伴随HIS的各项业务应用连接上线并逐步推广, 系统中现实和潜在的数据存储需求越来越大;数据的安全与容灾保护也越来越重要, 这两个方面问题成为系统的建设与管理者所面临的严峻挑战。

2 解决方案

以2台HPrx2660服务器组成双机集群, 承担HIS系统应用服务;以一台EMCCX300/CX3-10C为应用系统提供后台存储支持;以一台Adic磁带库为整个系统做数据备份。

本方案采用SAN架构, SAN技术的核心是SAN交换机, SAN交换机是存储系统和主机系统之间的桥梁, 由于采用交换技术, SAN交换机如同一个连接存储设备和主机设备的大立交桥。尽管SAN交换机上也配置CPU和CACHE, SAN交换机上也可以具有自我管理、自我配置等智能软件, 但SAN交换机主要作用还是作为数据交换通道。

实施效果:存储资源更加丰富, 系统和数据更加安全, 医院的业务和管理效率都得到了提高。

方案拓扑图如下:

拓扑说明:建设一个集数据存储、系统备份于一体的解决方案。该方案的核心内容包括:首先, 以2台HPrx2660服务器组成双机集群, 承担HIS系统应用服务, 并通过EMC光纤交换机于1套EMC CX300/CX3-10C构成SAN, 由CX300/CX3-10C为HIS系统中的数据提供后台存储支持;其次, 在SAN环境之内, 采用EMCAdic磁带库为整个系统做历史数据的备份。

在上述方案中, 采用功能强、容量大的CX300/CX3-10C磁盘阵列提供集中存储, 消除以往的存储瓶颈, 使HIS系统的信息存储与处理需求得到了满足;Adic提供全面备份, 保障整个HIS系统的数据完整性, HPrx2660双机集群保障HIS系统应用的高可用性以及业务连续性, 几大措施步步为营, 层层递进, 为整个系统打造了稳固的数据安全防线, 有效的提升了整个HIS系统的处理能力。

备份采用LAN-free方式进行, LAN-free有多种实施方式。通常, 用户都需要为每台服务器配备光纤通道适配器, 适配器负责把这些服务器连接到与一台或多台磁带机 (或磁带库) 相连的SAN上。同时, 还需要为服务器配备特定的管理软件, 通过它, 系统能够把块格式的数据从服务器内存、经SAN传输到磁带机或磁带库中。

3 产品特点

EMC CLARii ONCX3 UltraScale TM系列产品基于新型、突破性的架构和大量技术创新, 是一种任何竞争对手都无法比拟的中端存储方案。CX3UltraScale系列产品具有业界领先的应用性能, 新级别的扩展性、可靠性和经济性, 以及新级别的使用简便性, 使得CX3易于安装、管理和扩展。CX3是第三代CX系列产品, 当客户采用新技术时, 通过保证已有资源和资金的最佳利用, 继续了EMC对从CLARii ON技术上最大化客户可获取利益的承诺。

CX3 UltraScale结构基于最先进的I/O互连PCIExpre s s技术, 确保提供高带宽和低延迟。它是业界唯一能提供整个系统4Gb/s带宽的中端存储系统。由于目前很多的SAN还是基于2-Gb/s技术, 因此CX3存储系统设计为可以识别和支持混合速度的设备, 并且同时可以对不同速度的设备进行操作。此外, 随着客户要求的变化, 可以使用CLARii ON独特的虚拟LUN技术动态地将数据从一个存储层移到同一个CX3存储系统中较高或较低的层。

HP Inte grity rx2660服务器支持HP-UX11i、Micros oft Window s Se rve r2003、Linux和Ope nVMS等操作环境, 为用户提供了广泛的应用选择, 让用户根据工作负载选择合适的操作环境。此外, 用户还可以选择机架优化或立式 (噪音更低) 的外形以及PCI-X或PCIExpre s s/-X组合两种I/O技术, 最多可提供8个SAS驱动器的内部存储容量 (超过1.1 TB) , 还能够在机箱内进行处理器升级。Integrity rx2660动能服务器具备用户所期望的所有管理、可用性和安全特性, 支持针对异构IT环境中的部署和重新部署进行无缝的集成和管理。简单地说, HP Integrityrx2660动能服务器能够帮助用户轻松应对当前挑战, 同时兼顾基础设施的未来。

上一篇:中学生的网络生活现状下一篇:福建电视台新闻频道