数据容灾

2024-05-21

数据容灾(精选十篇)

数据容灾 篇1

随着业务发展, 信息系统已成为各部门进行社会管理与对外服务的重要工具, 信息系统中存储的各类数据直接关系到政府和公众的利益。随着信息系统的不断完善以及与之相配套的各类业务系统的应用, 日益增长的信息量必然发生大量的数据传输、存储和数据交换, 数据安全成为影响整个信息系统的一个重要因素为了应付区域性灾害, 如地震、海啸、战争等因素导致多个机房同时损毁, 数据永久性丢失, 其它如区域性的病毒泛滥、蓄意破坏、严重误操作等人为因素也可能导致同城备份中心失效。建立一套异地数据备份系统已经成为信息系统建设的必要组成部分, 会成为保证数据安全的最后一道防线。

本次项目将进行异地备份系统建设工作, 数据备份中心地点为省外某城市, 异地数据备份系统对数据中心的生产区及其它相关区域的数据实时同步, 并根据容灾等级布署相应业务服务器, 当大连中心机房不可用时, 异地机房能够保留中心机房的数据备份。

1 系统现状

1.1 数据库概况

2台IBM P595小型机 (LPAR) 组成Oracle RAC集群为生产区数据库服务器, 1台IBM P595小机为交换区数据库服务器, 生产区和交换区通过OracleStream技术进行数据交换, 数据库版本均为Oracle 10g 10.4.2版本, 操作系统均为AIX5.3。

1.2 业务数据量

目前生产区、交换区总共6TB的数据量, 其中生产区2.8TB, 交换区3.2TB。生产区以平均每月数据增长量约为80GB, 交换区数据量增长速度和生产区大体相等;生产区和交换机每月数据修改量约为220GB。

生产区数据库每日产生的log量约为40GB。

2 容灾指标

为了减少灾难带来的损失和保证信息系统所支持的关键业务功能在灾难发生后能及时恢复和继续运作。我国制定了《GB/T 20988-2007信息安全技术信息系统灾难恢复规范》, 《规范》对灾难恢复资源做出了如下分类:

(1) 数据备份系统:一般由数据备份的硬件、软件和数据备份介质 (以下简称“介质”) 组成, 如果是依靠电子传输的数据备份系统, 还包括数据备份线路和相应的通信设备;

(2) 备用数据处理系统:指备用的计算机、外围设备和软件;

(3) 备用网络系统:最终用户用来访问备用数据处理系统的网络, 包含备用网络通信设备和备用数据通信线路;

(4) 备用基础设施:灾难恢复所需的、支持灾难备份系统运行的建筑、设备和组织, 包括介质的场外存放场所、备用的机房及灾难恢复工作辅助设施, 以及容许灾难恢复人员连续停留的生活设施;

(5) 专业技术支持能力:对灾难恢复系统的运转提供支撑和综合保障的能力, 以实现灾难恢复系统的预期目标。包括硬件、系统软件和应用软件的问题分析和处理能力、网络系统安全运行管理能力、沟通协调能力等;

(6) 运行维护管理能力:包括运行环境管理、系统管理、安全管理和变更管理等;

3 总体方案

3.1容灾等级

据国际标准SHARE78的定义, 灾难恢复解决方案按恢复时间以及数据、系统、业务等层面的保障程度可以分为七级, 但信息系统中经常使用的等级只有0、1、2、3四种等级, 其它等级的解决方案已不再是单纯的IT系统方案, 需要行政管理流程和人力资源流程支持。

容灾等级中第0级为没有容灾系统, 其它常用的3种等级说明如下:

(1) 非实时数据容灾:容灾等级为第1数据安全项目级, 数据冷备份方式, 本地进行数据备份, 备份介质人工送至异地保存, 实现数据层面的容灾保障。此种方式没有硬件设备投入, 项目投资规模非常小。

(2) 实时数据容灾:容灾等级为第2级, 异地建立热备份中心, 数据通过网络以同步或异地方式备份, 容灾中心只备份数据, 不承担业务, 实现数据层面的容灾保障。此种方式容灾中心布署数据库及存储相关软、硬件产品, 项目投资规模较小。

(3) 应用级容灾:容灾等级为第3级, 本地和异地双中心可以进行数据互备, 当一个中心出现灾难时, 另一个中心可以接替其继续提供应用处理能力, 实现系统层面的容灾保障。此种方式容灾中心与数据中心结构类似, 需要布署业务软件、应用系统、数据库、存储、网络等方面相关产品, 并且需要为业务使用者提供一种网络切换机制, 项目投资规模较高。

本次项目考虑成本因素, 依照容灾等级第2级即实时性数据容灾的标准建设。[1]

3.2 方案总述

在省外, 租用机房, 并在两地间租用长途专线电路, 在异地机房租赁3~4台机柜放置一套数库据服务器, 两地数据库之间通过Oracle GoldenGate软件实现数据同步。在异地机房放置一台数据库安全审计设备, 对备份中心数据库的实例进行审计。当中心机房不可用时, 异地数据备份中心只保留数据, 不接管中心机房业务。

3.3 方案实现

3.3.1 数据同步实现

3.3.1.1同步方式选择

在建立异地数据备份系统时涉及到多种技术, 整体分为基于硬件的磁盘镜像技术和基于软件的数据复制两类, 劳动保障网的数据备份主要针对生产数据库, 因此基于软件的数据复制技术主要讨论数据库复制技术。基于硬件的磁盘镜像技术利用存储设备进行远程数据镜像, 这种技术的提供者通常是存储设备厂商, 数据复制完全通过专用线路实现物理设备之间的数据交换;基于软件的数据复制技术利用软件实现远程的实时数据复制, 并实现全程的高可用体系。一套完整的容灾系统可以包含多种技术的组合[2]。

(1) 基于存储的磁盘镜像技术

磁盘镜像技术利用磁盘镜像软件, 通过光纤直连、FC网络或IP网络等在数据备份中心与数据中心建立磁盘镜像连接, 实现业务数据的7×24小时远程实时备份。磁盘镜像数据备份系统采用基于盘控的复制技术, 通过磁盘系统微码提供的数据镜像功能, 将源磁盘数据复制至目标磁盘。磁盘镜像技术与主机系统平台无关, 但要求两地硬件存储平台相同, 能实现软件异构环境下的数据远程备份。

(2) 基于软件的数据库复制技术

利用开放系统上Oracle、Sybase、DB2等数据库系统自身的日志复制功能, 在数据备份中心建立业务系统数据库的备份数据库, 通过IP网络, 将业务数据库系统产生的归档日志实时传送到数据备份中心, 利用日志向备份数据库追加数据, 保持备份数据与生产数据同步。数据库日志的在线传输是基于应用层的, 能够支持多种服务平台如Solaris、AIX、Linux、Windows、HP-UX, 并支持多种数据库系统如Oracle、DB2、SQL Server等, 并且与硬件平台无关, 能够实现多种异构环境下的数据远程备份。

两种技术综合比较, 基于硬件的磁盘镜像对网络环境和网络通信协议要求较高, 但对服务器硬件没有要求, 对端有存储设备并且满足规格要求就能实现数据级灾备, 只在实现业务级灾备的情况下需要相应的服务器平台;基于软件的数据库复制技术, 对网络环境适应能力极强, 对网络和存储硬件平台没有特殊要求, 能够适应各种异构环境, 但基于软件的数据库复制技术无论是数据级灾备还是业务级灾备, 都要求异地数据备份中心必须有备份数据库服务器, 服务器具备一定的处理能力, 同步完成备份数据库的数据增删及修改操作, 保持两地数据同步。异地数据备份系统的建设选择何种技术受限于实际客观环境限制, 在异地搭建的异地数据备份中心具有以下特点:

①两地之间陆地距离超过1500公里而且地域跨省, 难以使用祼光纤链路

②两地之间只能通过IP网络互联

③两地之间难以建立高速通信链路

④同样带宽, 省际电路租金远远高于市内电路。

无论采用存储镜像方式还是数据库复制方式, 其容灾数据丢失量均取决于两地机房之间的通信链路带宽, 基于软件的数据库复制方式由于只传送事务日志, 对网络带宽需求较低。由于两地之间只能通过IP网络互联而且没有二层透明网络, 目前信息中心在用的IBM DS8300存储没有iSCSI接口, 因此如果采用存储镜像方式, 需要在互联链路两端增加多协议路由器完成FC协议族和IP协议族之间的互相转换, 同时仍然需要购买存储远程镜像软件授权。相比之下, 基于软件的数据库复制方式对于网络没有特殊要求, 网络环境适应能力更强。在跨省异地容灾情况下, 最需要考虑而且无法人为改变的是互联网络环境, 综合成本、风险、技术可行性、维护等方面考虑, 在异地建立的异地数据备份中心采用基于软件的方式实现数据同步, 由于灾备数据只针对数据库, 软件采用Oracle GoldenGate产品。其技术原理如下:

GoldenGate基于数据库日志原理如上图, 初始化加载后, 增量复制由若干进程协同完成:

(a) 抽取进程 (Capture) 抽取数据库日志, 生成队列文件 (Trail File) ;

(b) 转发进程 (Pump) 将队列文件发送给接收进程 (Collector) ;

投递进程 (Deliver) 将接收到的队列文件投递到目标数据库。[3]

3.3.2 网络实现

3.3.2.1 网络线路选择

在实时数据级灾备级别下, 只考虑两地机房之间的互联线路, 不需要考虑经办机构及业务网点与异地机房的连接。

大连与异地之间地域跨省, 陆上距离超过1500公里, 两地机房难以实现祼光纤直联。联网方式采用租用专线电路 (SDH或MPLS) 。

VPN方式能够解决数据安全传输问题, 但线路质量和可用性依赖于互联网, 由于两个机房之间需要实时同步业务数据, 网络互联线路不稳定或可用带宽频繁跳动直接导致业务数据丢失量 (RPO) 指标难以预测, 因此本次项目两地机房之间计划租用专线电路互联, SDH电路或MPLS电路均可。租用线路带宽随时可以扩容, 根据现阶段的实际业务数据量估算带宽需求即可, 目前阶段的电路带宽需求见《容灾指标》一节所述。

3.3.2.2 流量控制

两个机房之间的专线电路承载两种类型网络流量:

(1) 两地数据库之间的数据同步流量。

(2) 中心机房对异地机房的远程网管、维护、监控流量。

必须设定两地之间流量管理策略, 以防止管理流量滥用网络带宽影响两地数据同步, 进而影响容灾数据丢失量指标。在专线电路两端的路由器上设定Qos策略:

①制定访问控制列表, 利用源和目标IP识别两种网络流量

②设定队列调度策略, 例如保证数据同步流量最小可用带宽为线路总带宽90%

③限制网管流量, 例如限制最大带宽为线路总带宽10%

数据同步流量优先级高于网管流量, 无论线路空闲与繁忙, 数据同步流量均可以使用线路100%的可用带宽。对于网管流量, 线路空闲时最大可以使用10%带宽, 线路繁忙时可使用的带宽为0, 或者设定一个非常小的网管流量保证值。

4 容灾指标

4.1 数据丢失量

异地数据备份系统的数据同步延迟取决于两地之间的专线电路带宽, 按照现有的业务量计算, 生产库平均每工作日log量约为40GB, 不考虑数据传输压缩比并且按照平均值计算, 需要40GB/ (8*3600) *8≈11.4Mbps速率以上带宽, 需要租用1条10Mbps专线电路, 数据同步延迟为分钟级。

4.2 业务恢复周期

在实时数据级灾备体系下, 异地机房只保留数据备份不接管中心机房业务, 而且容灾机房的数据库服务器性能不足以支撑所有用户数据读写操作。灾难回切时中心机房需要重新建立服务器、数据库、网络等基础环境后方能恢复业务。

5 结束语

通过数据异地容灾系统的建设, 更进一步采用现代化的手段和规范化的管理程序整合信息系统平台的各种资源, 为防范自然灾害、保证数据安全建立最后一道防线, 为建立安全可靠的信息系统提供坚实的技术支持, 为社会的稳定和人们的生活提供有效的保障。

参考文献

[1]国际标准SHARE78灾难恢复等级划分[S].

[2]汤泳, 吕英杰.数据容灾技术介绍[N].邮电设计技术, 2002年10月.

数据中心容灾备份方案 篇2

医院备份、容灾及归档数据容灾

解决方案

1、前言

在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。医院信息化 HIS、LIS 和 PACS 等系统是目前各个医院的核心业务系统,承担了病人诊疗信息、行政管理信息、检验信息的录入、查询及监控等工作,任何的系统停机或数据丢失轻则降低患者的满意度、医院的信誉丢失,重则引起医患纠纷、法律问题或社会问题。为了保证各业务系统的高可用性,必须针对核心系统建立数据安全保护,做到“不停、不丢、可追查”,以确保核心业务系统得到全面保护。

随着电子病历新规在 4 月 1 日的正式施行,《电子病历应用管理规范(试行)》要求电子病历的书写、存储、使用和封存等均需按相关规定进行,根据规范,门(急)诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于 15 年;住院电子病历保存时间自患者最后一次出院之日起不少于 30 年。

2、医院备份、容灾及归档解决方案

针对医疗卫生行业的特点和医院信息化建设中的主要应用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于数据保护系统的多种解决方案,以达到对医院信息化系统提供全面的保护以及核心应用系统的异地备份容灾

2.1 数据备份解决方案

针对于医院的 HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统的备份架构采用三层构架。

备份软件主控层(内置一体机):负责管理制定全域内的备份策略和跟踪客户端的备份,能够管理磁盘空间和磁带库库及光盘库,实现多个客户端的数据备份。备份软件主服务器是备份域内集中管理的核心。

客户端层(数据库和操作系统客户端):其他应用服务器和数据库服务器安装备份软件 标准客户端,通过这个客户端完成每台服务器的 LAN 或 LAN-FREE 备份工作。另外,为包含数据库的客户端安装数据库代理程序,从而保证数据库的在线热备份。备份介质层(内置虚拟带库):主流备份介质有备份存储或虚拟带库等磁盘介质、物理磁带库等,一般建议将备份存储或虚拟带库等磁盘介质作为一级备份介质,用于近期的备份数据存放,将物理磁带库或者光盘库作为二级备份介质,用于长期的备份数据存放。

2.2 应用级容灾解决方案

实时保护,可实现对医院信息系统中核心业务系统的持续数据保护。在核心业务系统应用数据写入被保护服务器自身存储的同时,写入存储设备中,颗粒度到秒级,最佳情况下可实现零数据丢失,通过镜像功能保证连接的磁盘阵列中的数据与被保护的数据完全一致。同时,利用截获每个写I/O 功能并进行记录,并且可基于时间点的快照进行回滚,此功能能够在被保护服务器发生逻辑错误时,快速有效地进行每 I/O 节点或快照点的挂载,避免逻辑错误造成的数据损坏。当存储系统宕机等灾难发生时,采用快速挂载功能,可以最快在分钟级别内迅速恢复前端应用或数据库服数据功能,保证业务的连续性。

分流器:截取主机写操作(块级别), 主机每次对被保护磁盘的写操作均被镜像写入到镜像数据写入过程在主机的主存储读写路径之外。

数据卷:保存主机分流器写入的所有数据。

记录卷和一致性代理:保存主机分流器写入的 I/O 记录根据应用特点 , 通过技术中的一致性代理实现对 ORACLE、MS SQL 等数据库在保存应用数据一致性快照使数据能够快速恢复到任意 I/O 记录。2.3数据系统长期归档解决方案

可通过高级备份功能,把电子病历、PACS 影像等数据备份到内置空间后,归档一份到光存储中,通过光存储的可长期保留特性,实现数据的长期保留(最长可到 100 年以上),满足法规要求。

2.4数据系统容灾解决方案

数据保护系统内置灾备功能,可实现数据及应用级别的容灾,可支持一对一,多对一等多种拓朴架构,系统可互为源端及目标端,完成异地备份、恢复功能。

1)数据级容灾:

备份数据保存在设备中,各备份点的数据可独立管理,可实现异机恢复,提高数据的安全性。

2)应用级容灾:

数据保护系统的 CDP 功能把数据持续保护在本地设备时,并可把本地CDP 数据复制一份到异地,CDP 的卷可以直接在异地直接挂载使用,结合虚拟机功能实现应用级容灾。

3、方案优势

数据保护系统提供的数据备份、CDP 及归档功能一体解决方案,满足医院信息系统的数据安全、应用级容灾及法规要求(电子病历数据长期保存的要求)的业务需求,解决方案优势如下:

1)软硬一体化结构,数据保护系统是多功能于一体的数据保护设备。包含了备份、CDP、存储(FC、ISCSI 及 NAS)及数据归档等多种功能,更加经济实用。并且部署简单,插入网线后进行简单配置后即可开始使用。

2)支持 FC、千兆及万兆网络等链路,灵活部署。

3)在同一台设备支持部署定时备份、CDP 功能,针对不同应用级别提供不同的保护方式。

4)具备远程复制功能,两台以上的设备可以实现远程复制,任意两台设备都可以作为发送端与接收端进行相互的远程复制,实现异地容灾,使数据更加安全。

5)具有高级备份功能,能实现 PACS 等大量的非结构化数据的不打包备份,可实现 100TB 级别以上的非结构化数据的光盘库出库归档,同时采用高级备份时光盘库恢复可通过备份系统和光盘库直接恢复等多种方式恢复方式,更加安全可靠。

数据容灾技术综述 篇3

[关键词]网络安全容灾RAID双机热备

一、引言

计算机网络的广泛应用对社会经济、科学研究、文化发展产生重大的影响,同时,网络也越来越深入平常百姓的家庭。网络已经成为日常生活及科研机构不可或缺的一部分。在这些繁荣的背后,都存在着大量的数据来支撑整个系统的运行。从各种数据服务器到提供通信链路的各种网络设备,没有一种能离开数据的存储。数据服务器把各种有用的数据保存在外部存储器中,像硬盘、磁带、光盘等设备。网络设备则把运行中的数据存储在内存中,为用户提供实时稳定的数据链路。这些数据是保证网络安全的基础,如果数据丢失,则会给企业和用户带来不可估量的损失。因此,目前存在着很多种数据备份和恢复的方案应用于不同的系统中。在本文中,按照数据存储的方式不同,把数据容灾方案划分为两类:基于外存储器的容灾技术和基于内存储器的容灾技术。

二、基于外存储器的容灾技术

由于外部存储器具有数据存储不易丢失、存储容量大的优点,因此,在具体应用中,用户把大量的数据信息通过各种不同的方式保存在外存储器中。

(一)RAID磁盘阵列方式

RAID(Redundant Array of Independent Disk)是指廉价磁盘冗余阵列。这种方式可以在一张磁盘或磁盘组之间提供数据的保存与备份。RAID网络存储技术主要利用网络技术实现信息的异地存储,数据不再直接存储在本地服务器上,而是储存在远端的数据服务器上,并且还可以通过网络保存在与远端服务器相连的专门设备上Ⅲ。在系统中RAID被看作是一个逻辑分区,但它是由多个硬盘组成的,通过在多个硬盘上同时储存和读取数据来大幅度提高存储系统的数据吞吐量,而且在很多RAID模式中都有较为完备的、相互校验与恢复的措施,甚至是直接相互的镜像存储。当数据灾难发生时可以自动修复,从而大大提高了RAID系统的容错度,提高了系统的冗余性。目前,RAID是一种比较规范的技术标准,现在已经存在RAID0~RAID6共7种不同的级别。每一种级别均按照数据读写、备份的规则进行设计,级别越高,其备份或镜像的程度也越高,但是数据读写的速率却不是随着级别的增加而增加的。

(二)数据库定期备份方式

对于一些小型网站或服务器,由于其规模有限,经济上不允许使用RAID的方式来进行数据的备份,因此,其往往使用数据库定期备份的方式将服务器中的相关数据进行增量备份,然后将备份后的文件复制到其他位置,例如磁带等。

数据库的备份有多种方式:完全备份、差异备份、增量备份。

完全备份是备份系统中的所有数据。执行此种备份方式时,备份耗时较长,但是一旦出现问题,在进行恢复时耗时最短,可以在比较短的时间内恢复数据。此种备份比较适合于阶段性的备份,比如一个月或半年等。

差异备份是备份上次完全备份后有变化的数据。这种备份方式耗时比完全备份要短,而且如果数据变化不大,备份后的文件也比较小。但是在执行恢复操作时,需要先执行先前的完全备份,然后再将差异备份的内容按照备份时的时间顺序进行逐个恢复。此种备份适合于数据变化不大的小型数据系统。

增量备份是只备份上次备份后有变化的数据。这种数据备份方式速度最快,备份的数据量也是最小的。在系统中的数据变化比较大的情况下,使用增量备份方式可以比较快速有效地完成数据备份任务。但是此种方式在进行数据恢复时却是最慢的。

每一种备份方式均有其优点和缺点,在实际的应用过程中,往往将这些方式组合起来使用,比如完全备份与增量备份结合使用等。

(三)双机热备方式

上述两种方式进行数据备份时,一旦出现计算机故障或磁盘故障,系统的恢复时间都较长,会有至少几个小时的恢复期。这样的特点不能被一些要求比较高的系统所接受。例如,电信计费系统会要求“不断流”,也就是说在系统出现故障时,系统能在几分钟甚至几秒的时间内恢复。针对这种情况,有人提出了双机热备的方式来进行数据的备份。

双机热备方式的国外代表产品是NCR LifeKepper和OctoPus。它们采用TCP/IP技术来保持工作机和备用机之间的数据同步。两台机器采用相同的硬件和软件配置,在双机之间通过RS232连接线或网线建立连接,以形成心跳。通过这种心跳机制,双机可以互相检测到对方的存在,从而可以形成双机之间的数据同步及故障切换。

目前在国内,已经存在使用纯软件的双机热备方案和面向应用级的双机热备方案[3,4],并且这两种方案已经得到了很好的应用。

通过上述分析,给出这几种容灾方案优点与缺点的对比(如表1)。

三、基于内存储器的容灾技术

在各种网络设备及通信网络的核心区域中,由于其所处的位置的特殊性,要求其必须具有很强的实时性,以为用户提供及时可靠的网络通信链路。因此,在这样的网络设备中,大多没有容量很大的外部存储器,只有内存可供用户保存数据。而内存具有访问速度快、数据无法永久保存的特点,因此,在为这样的网络设备设置容灾方案时,一般都采用双板或双机的数据热备份方案。

(一)双板热备方式

在网络设备中,其计算机硬件往往是特殊制作的,比如大型路由器等。它们在网络通信中所处的位置决定了这些设备不允许出现故障。但是设备不可能设计的那么完美,它们总是可能在某种条件下出现问题。另外,在设备进行升级时,系统也需要进行“断流”的操作,临时不能提供服务。为了解决上述问题,一个设备中往往设计成两块板卡,一块是主用板,另一块则是备用板。当系统出现故障或需要升级时,备用板主动切换到主用板,此时新的主用板上的数据与原来的主用板完全相同,不存在“断流”的情况。当解决了故障或升级完成后,将新的板卡插入设备中,执行数据备份的任务。

这种方式适合于非自然性故障,比如主板损坏或设备升级等。但是如果存在机房断电或自然灾害等情况时,往往无法及时恢复服务。

(二)双机热备方式

在这里的双机热备方式不同于面向大容量服务器的双机热备方式,它是采用修改操作系统协议栈的方式来进行的。由于这类计算机系统一般都是嵌入式系统,其操作系统往往是开放源码的嵌入式操作系统,因此,系统内核中的协议栈是可以修改的。与服务器下的双机热备方式相同,它也需要将两台机器设置相同的硬件和软件配置,双机之间建立网络连接,互相检测对方是否在线。一般情况下,当双机同时启动时,通过一定的方式来确定主备机。非同时启动时,先启动的作为主机,后启动的作为备机。整个系统使用主机的IP地址来提供服务,同时由主机向备机传送实时数据,而备机则只接受主机传送的数据。当主机出现问题无法继续提供服务时,双机检测模块会将备机实时转换为主机,继续提供服务,从而实现“不断流”。如图1所示。

一般情况下,两台服务器可以分别放置在不同的区域,可以相隔较远。这种数据备份方式既能在主机发生故障,还能在发生断电或自然灾害等情况下,保证系统仍然能正常服务。但是在进行系统升级时,仍然需要结合双板备份的方式进行。

四、结语

数据中心容灾备份系统 篇4

数据中心容灾备份系统简称“灾备系统”, 又称为灾难恢复系统或灾难备份系统。灾备系统是数据中心保护数据的最后手段, 其建设是一项系统工程, 不但涉及数据中心的服务器、存储、网络, 而且涉及组织架构、业务流程、规章制度、外部协作关系、资金投入等各个方面。灾备系统需要对可能遭受的风险进行风险分析和业务影响分析, 结合数据中心的现状进行设计, 同时筹备所需的各种资源, 制定详细的任务进度计划, 通过严格的项目设施管理措施, 才能保证项目的质量和进度的要求。

对此, 本刊以“数据中心容灾备份系统”为专题, 特别安排了《数据中心灾备系统的规划》、《数据中心灾备系统的分类》、《数据中心灾备系统的组成》、《数据中心灾难恢复的策略》、《灾备数据中心的基础架构的思考》、《大型综合布线系统的灾难备份思考》的文章, 希望通过本期专题的介绍, 帮助您对数据中心容灾备份系统的了解。

本栏目欢迎您提出宝贵意见与建议, 感谢您的参与与支持!

数据容灾 篇5

论数据备份与容灾系统在图书馆数据安全中的应用

文章对自然灾害和人为灾害造成图书馆数据安全隐患进行了分析,简述了数据备份与容灾系统在图书馆数据安全中的`应用.

作 者:李正艳 作者单位:四川文理学院,图书馆,四川,达州,635000刊 名:内蒙古科技与经济英文刊名:INNER MONGOLIA SCIENCE TECHNOLOGY AND ECONOMY年,卷(期):“”(7)分类号:G250.7关键词:数据备份 容灾系统 数据安全

数据管理中心容灾备份系统建设浅析 篇6

为了使获取的数据全面、快捷、有效,诞生了大数据业务,建立数据中心,将数据集中存放、集中处理,这种新的数据管理模式可以很容易实现数据共享、新业务的开发和降低计算中心的运营成本。然而,单一数据中心运行的这种模式也有一个致命的缺陷:一旦数据中心发生灾难,受到影响的将是整个业务,于是容灾备份系统应运而生。

1.容灾备份系统简介

容灾备份是利用一定的容灾机制,当灾难发生后,它能够最大限度地恢复信息系统及数据的正常运行,可分为数据备份和应用备份。数据备份需要保证用户数据的完整性、可靠性和一致性,它是容灾系统的基础,也是容灾系统能够正常工作的保障,当主站点发生灾难时,备份站点仍然保存着数据的副本,从而达到保护数据的目的;应用备份是容灾系统的建设目标,它建立在数据备份的基础之上,通过应用系统、网络系统等各种资源之间的良好协调来实现。一旦主站点发生灾难,将由备份站点接管整个应用系统,继续对外提供服务,它不仅要保存数据,而且要保证业务系统的连续性。

根据IBM公司SHARE78标准,容灾技术可以分为7个层次,从无任何容灾备份措施,到将备份的磁带存储在异地,再到建立应用系统实时切换的异地容灾备份中心,数据和应用的恢复时间从数天到几个小时甚至几秒不等。一个完整的容灾备份系统包括本地数据备份、远程数据复制和异地备份中心。设计一个容灾备份系统,需要考虑多方面的因素,如备份数据量大小、应用数据中心和备份数据中心之间的距离、传输方式、灾难发生时所需要的恢复时间等。根据这些因素和不同的应用场合,可将容灾备份分为以下四个等级:

第0级:没有备援中心。这一级容灾备份,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。

第1级:本地磁带备份,异地保存。在本地将关键数据备份,然后送往异地保存。灾难发生后,按预定数据恢复程序恢复系统和数据。

第2级:热备份站点备份。在异地建立一个热备份站点,通过承载网络以同步或异步方式进行数据备份,把主站点的数据备份到备份站点。当主站点工作正常时,备份站点只进行数据备份;当主站点出现灾难时,备份站点立即接替主站点业务,从而保证业务运行的连续性。

第3级:活动备援中心。在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互的数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份根据实际要求和投入的资金多少,又可分为两种:一是两个数据中心之间只限于关键数据的相互备份;二是两个数据中心之间互为镜像,即零数据丢失。零数据丢失是目前要求最高的一种容灾备份方式,它要求不管发生什么灾难,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和硬件设施。

2.容灾备份系统分析

2.1容灾备份系统组成

容灾网络分为内部局域网和外连网。内部局域网采用统一交换技术体制,建立统一网络交换平台,并组成冗余热备结构,存储设备、容灾设备应采用两条以上冗余链路接入,按照服务级别、安全管理、运维管理以及服务保障需要,划分为容灾服务区1~n、安全管理区、运维管理区、服务保障区等多个分区;外连网采用动态OSPF路由协议分别接入所属区域网络的主干节点。

数据存储系统分为同步存储和异步存储。同步存储的存储设备为双机热备结构,异步的存储设备可单机运行,结合网络分区,进行存储分区,并具备无缝扩展能力。

容灾备份系统应具备快照保护功能、同步镜像功能、异步复制功能、分布式冗余保护功能和数据备份功能。快照保护功能为容灾备份实施提供数据支撑;同步镜像功能为用户信息系统建立同步数据容灾机制;异步复制功能为用户信息系统建立异步数据容灾机制;分布式冗余保护功能建立容灾备份中心之间分布式数据容灾机制;数据备份功能提供用户容灾数据在容灾备份中心再次备份保护。

安全保密系统应从网络安全、存储安全、容灾备份安全等方面进行整体安全防护。应具备网络访问控制、入侵检测预警、容灾协议增强等网络防护机制;还应具备数据卷完整性保护、面向用户的存储加密、敏感数据防泄漏等存储保护机制和身份认证、访问控制权限、数据一致性、完整性校验、分布式冗余等容灾备份保护机制。

运维管理系统应具备配置管理功能、拓扑管理功能、故障管理功能、性能管理功能、资源管理功能和系统管理功能。配置管理功能提供各类设备和系统配置信息的提取下载、关联展现和查询统计;拓扑管理功能提供设备发现、拓扑识别、可视化展现以及运行状态的实时监控;故障管理功能提供各类设备和系统运行故障的检测、告警、定位、分析和处理;性能管理功能提供各类设备和系统的流量监控、采集、分析和查询统计;资源管理功能提供系统所有设施和存储资源(包括设备配备、系统部署、物理空间、逻辑空间、出入库磁带介质等)的统一管理、关联展现以及各种资源信息的查询统计;系统管理功能提供系统的维护和管理,包括系统定制、日志管理、操作员管理等。

2.2容灾备份系统对业务系统的影响分析

数据复制操作的发起来自业务系统,因此无论来自系统的计算层、网络层还是存储层,肯定会影响到业务系统的性能。对于那些高性能的业务系统或者已经是高负荷运行的业务系统,必须分析建立容灾系统对业务系统性能的影响。不同容灾技术对业务系统性能的影响不同,比如,一个采用同步数据复制技术的容灾解决方案,如果备份中心与业务中心距离超过100km以上,需要考虑数据传输时延对业务系统I/O性能造成的影响,距离越远,业务系统I/O性能下降速度越快。

容灾备份系统运行平稳后,需要对备份数据的可用性进行检查。正常情况下,备份中心的数据是不能打开使用的,只有在业务系统工作中断,或者切断容灾进程的情况下,才能够对备份数据的可用性进行检查,这样势必对业务系统正常运行产生影响。由于网络传输拥塞或者中断等原因,数据复制同样会造成业务系统性能下降甚至业务运行中断,当等待传输的数据溢出数据复制发起端的缓冲区时,有可能造成数据的丢失,或者数据传输次序的混乱,破坏备份数据库的一致性,造成数据库不可恢复。

3.建设容灾备份系统应该注意的问题

(1)系统应该具有开放性,不依赖特定硬件系统。

(2)应支持广泛的传输介质。

(3)考虑到容灾能力和对应用系统性能的影响,容灾方案不仅要支持近距离、同步的数据容灾方式,还必须支持远程的、异步的数据容灾。

(4)对于异步数据容灾,数据复制技术不仅要求在异地有一份数据拷贝,而且必须保证异地数据的完整性、可用性。

(5)容灾系统本身应具备各种容错考虑。

(6)应支持灵活多样的容灾结构。

企业数据备份与容灾技术分析 篇7

一、造成数据丢失、损坏的因素

引起数据丢失或损坏的原因很多, 有可能是人为的因素, 也可能是非人为的因素, 主要包括以下几个方面:计算机硬件造成的、计算机软件引起的、人为因素产生的、病毒因素和不可控因素, 如自然灾害。

二、数据备份策略

按照备份策略分, 现在的备份可分为:完全备份、增量备份、差异备份、累加备份策略[1]。

完全备份就是将计算机上的所有数据完全拷贝下来, 即使数据没有发生变化。

增量备份就是只将上一次备份后增加、改动的部分数据备份。

差异备份只将上一次完全备份后发生变化的那一部分数据进行备份。

累加备份利用数据库的管理模式, 记录并累计各个时间点的变化, 同时把变化后的数据备份到存储设备当中。

在具体使用是, 这几种策略经常结合使用, 经常采用的方法包括以下几种:完全备份、完全备份加增量备份、完全备份加差异备份、完全备份加累加备份。

三、容灾系统的划分及实现方法

容灾准确地说, 它是一项工程, 而不应仅仅看成是技术。很多用户还停留在对容灾技术的关注上, 而对容灾的流程、规范及其具体措施还不是很清楚。也从不对容灾方案的可行性进行评估, 认为只要建立了容灾方案即可高枕无忧, 其实这具有很大风险。特别一些中小企业认为自己的企业为了数据备份和容灾, 整年花费了大量的人力和财力, 而结果几年下来根本就没有发生任何大的灾难, 于是放松了警惕。可一旦发生了灾难时, 后悔晚矣!这一点国外的跨国公司就做得非常好, 尽管几年下来的确未出现大的灾难, 备份了那么磁带, 几乎没有派上任何用场, 但仍一如既往、非常认真地做好每一步, 并且基本上每月都有对现行容灾方案的可行性进行评估, 进行实地演练。在国务院信息化工作办公室发布的《重要信息系统灾难恢复指南》中定义了容灾系统的概念:由于人为或者自然的原因, 造成信息系统运行严重故障或瘫痪, 使信息系统支持的业务功能停顿或者服务水平不可接受、达到特定的时间的突发事件, 需要将信息系统从灾难造成的故障或者瘫痪状态恢复到可正常运行状态, 并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态。容灾系统是利用在异地建立和维护起来的一个备份存储系统, 根据地理位置分离来保证系统和数据在灾难时的安全[2]。

依据实现方式不同, 容灾方式分为非数据库级和数据库级容灾。非数据库级容灾特点是:复制磁盘上的所有数据, 包括数据库/文件等, 可以对整个系统进行灾难防护;支持同步复制和异步复制两种方式;在同步复制下, 提供最佳的灾难恢复支持;因为可以构建存储区域网络, 因此复制速度比较快。这种方式存在一些缺点, 对于硬件阵列卡和操作系统的容灾技术, 要求硬件环境完全相同, 导致投资比较大;对设备有特殊要求, 不能支持异构环境下的复制;因为复制的数据量比较大, 因此带宽需求比较高;这种容灾下, 容灾端只能处于冷状态, 不能打开其上的应用, 如数据库;对于其上有活动性比较大的应用, 如数据库, 其可靠性比较差。

数据库级容灾是建立在数据库基础上, 它将源数据库中的数据库通过逻辑的方式在异地建立一个同样的数据库, 并且实时更新 (延迟不大于5秒) , 当主数据库发生灾难的时候可以及时接管业务系统, 达到容灾的目的。其特点为:所有复制技术均满足大多数容灾系统的需求;从数据库级实现基本的数据同步;容灾系统在平时是可以使用的, 且可以隔离运行系统中出现的逻辑错误;通过建立容灾系统, 与备份系统互为补充;支持异构平台, 因此可以利旧, 从而节省投资;其缺点为:利用整个归档日志传输进行复制, 延迟较大;将整个日志文件传送到目的系统, 传输量大;不数据库必须相同 (version/OS/SID) ;容灾数据库必须作为主数据库的Standby存在;容灾数据单线程处理日志应用, 性能低下。

容灾系统设计, 需要考虑因素很多, 比如说, 数据量的多少、原系统数据和备份数据中心之间的距离及其数据传输方式、恢复速度的要求、备份中心的管理及资金投入等。根据以上因素和应用场合的不同, 可以将容灾系统分为如下四个等级。

第0级:这一级没有备援中心, 它只在本地对数据进行备份, 而且备份数据只在本地保存, 实际上没有灾难恢复能力。

第1级:在本地利用磁带机进行数据备份, 然后放在异地保存。

第2级:热备份站点备份是利用网络进行数据备份, 即在异地建立一个热备份点。

第3级:活动备援中心是指在两个距离较远的地方分别建立两个数据中心, 平时两个都处于工作状态, 并且相互间可以进行数据备份。

四、结论

随着信息技术在企业中的应用日益广泛和深入, 数据也变得越来越重要。加强数据备份和灾难恢复系统建设, 是确保企业信息系统持续正常进行的重要举措, 关系到企业能否在竞争激烈的商场中立于不败之地的关键环节。因此, 必须充分认识到企业数据和数据备份的重要性, 做到未雨绸缪, 积极建设企业数据备份系统, 采用全方位、多层次的数据备份和灾难恢复技术, 保护企业信息系统数据的安全。只有这样, 才能保障企业信息系统安全可靠、不间断的运行。

参考文献

[1]金崇英.在线备份和异地容灾软件的设计与分析[J].计算机应用与软件, 2008 (08) .

多级数据容灾系统的设计与实现 篇8

2011年的“9.11”事件告诉了我们答案——“数据”。

“9.11”美国世贸大厦的倒塌, 有800多家公司和机构的重要数据被深埋。事故一年后, 重返世贸大厦的企业由原先的350家变成150家, 另外200家企业由于重要信息系统的破坏、关键数据的丢失而永远的关闭消失了。根据IDC的调查, 美国在2000年以前的10年间发生过数据灾难的公司中, 55%当时倒闭, 剩下的45%中, 因为数据丢失29%在两年内倒闭, 生存下来的仅占16%。在类似的调查报告中, Gartner的数据表明, 2/5企业没有恢复运营, 剩下的也有1/3在两年内破产。

对于新闻媒体单位来说, 数据更是生命之源, 发展之本。一旦发生了数据性灾难, 那损失将是不可想象的。因此建立完善的数据容灾系统将是我们不得不面对的课题。

1 如何衡量数据容灾系统

衡量一个数据容灾系统的好坏, 有两个最主要的技术指标为RPO和RTO:

(1) RPO:Recovery Point Object恢复点目标

灾难发生后, 系统和数据必须恢复到的时间点要求, 代表了当灾难发生时允许丢失的数据量。

(2) RTO:Recovery Time Object恢复时间目标

灾难发生后, 信息系统或业务功能从停顿到必须恢复的时间要求, 代表了系统恢复的时间。

2 传统的数据容灾

提到传统的数据容灾系统, 关键词就是“复制”。所谓“复制”, 就是将某事物通过某种方式制作成相同的一份或多份的行为。

传统的数据容灾系统简单而言就是将核心数据通过各种复制技术, 采用同步或异步方式从主站复制到各个地方, 例如灾备站点, 磁带库等等。当主站系统发生硬件故障或自然灾害时, 可以将数据还原或直接投入使用。

但是数据灾难并不是都是硬件故障或自然灾害造成的, 那么由于操作员操作失误、黑客入侵、病毒泛滥等逻辑故障造成的数据灾难发生了, 我们该怎么办呢?设备的硬件故障, 我们可以通过监控硬件设备的状态尽早发现, 但是由于逻辑故障引起的数据逻辑错误在现有的监控系统下发现比较困难。往往发现数据逻辑错误时, 实时同步方式备份的数据, 由于复制技术的局限性, 也将逻辑错误复制了过去。此时, 采用传统数据容灾技术的人们只有寄希望于采用异步方式复制的数据由于时间差的原因, 没有被损坏。但往往此时, 即是数据恢复回来, RPO和RTO也无法预估。

3 新闻媒体的数据容灾现状

随着“报网融合”进程的不断前进, 传统新闻媒体都面临着大量数据如何集中存储和备份、存储容量增长速度过快、存储设备过多和管理复杂等等问题。采用传统分级存储的方式, 已经无法实现数据的集中管理和应用。这对于“报网融合”发展无疑是一个极大的障碍。各家媒体大都搭建统一化存储架构, 实现数据的统一存储、管理和应用, 但是信息数据海量增长、信息系统支撑的业务高度集中和信息存储网络化, 不但使得信息数据的重要性日益凸显, 同时也加大了各类风险的发生概率。为了避免因为各种意外情况而带来的数据性灾难, 国内领先的报社和通讯社已经开始建立各自的数据容灾系统。

例如, 报社A是目前我国被境外各大通讯社、报刊、电台、电视台转载最高的媒体之一。该报社为了保障其核心数据资源的安全, 分别对核心数据库系统和共享式文件系统进行了容灾备份建设。其中数据库系统采用了Oracle公司提供的一种基于数据库远程复制的技术——OracleData Guard软件实现数据级容灾, 数据库在主站点和IDC站点的数据库实例均处于实时活动状态, 可以进行各种操作, 且通过OracleData Guard的实时同步功能实现数据库的实时同步。但OracleData Guard技术仅是一种复制技术, 无法解决数据的逻辑错误带来的问题。针对该问题, 则需要通过离线的虚拟带库的备份系统来解决, RPO和RTO无法预估。报社A的NAS共享式文件系统则采用了EMC公司的Replicator软件+“快照”技术实现数据级容灾。Replicator软件是EMC公司针对其NAS文件级共享存储设备提供的一种数据复制技术。而所谓“快照”, 则是指关于指定数据集合的一个完全可用拷贝, 该拷贝包括相应数据在某个时间点 (拷贝开始的时间点) 的映像。快照可以是其所表示的数据的一个副本, 也可以是数据的一个复制品。采用“快照”技术, 当该报社发现数据逻辑错误时, 可以及时调用快照映像, 恢复至最近时间点的完整数据。实现RPO为“10分钟”。

网站B属于中央级重点、权威网络媒体。该网站拥有两个托管机房, 互为应用级灾备。核心数据库通过复制技术实现数据容灾, 每天一全备, 30分钟一增备, 实现RPO为“30分钟”。共享式文件系统容灾也是通过复制技术实现数据容灾, RPO和RTO无法预估。

信息中心C为中国国家级综合性科技信息机构, 并托管了多家网站。该信息中心数据库系统采用了虚拟带库的备份方式实现数据容灾, 共享式文件系统则通过复制技术, 复制到物理隔离的内网存储系统, 实现数据容灾。两种数据的容灾RPO和RTO都无法预估。

4 采用CDP技术和快照技术的数据容灾

4.1 什么是CDP

CDP (Continuous Data Protection, 持续数据保护) , 它可以捕获或跟踪数据的变化, 并将其在生产数据之外独立存放, 以确保数据可以恢复到过去的任意时间点。持续数据保护系统可以基于块、文件或应用实现, 可以为恢复对象提供足够细的恢复粒度, 实现几乎无限多的恢复时间点。当由于各种故障原因造成数据损伤时, 可以选择几乎无限接近故障时间点的恢复点, 实现数据的“0”丢失, 即RPO为“0”。它是对传统数据备份技术的一次革命性的重大突破。它的缺点在于只能用于SAN存储。而对于网站上大量采用的NAS文件共享式存储却无能为力。

4.2 快照技术

CDP技术无法解决NAS文件共享式存储的数据容灾问题。近似CDP技术的快照技术解决了该问题。EMC公司的Replicator软件+“快照”技术, 在数据复制的同时通过“10分钟级”甚至于“5分钟级”的快照, 使在NAS文件共享式存储的数据容灾实现了RPO为“10分钟”甚至于“5分钟”。现在越来越多的存储设备开始支持快照技术。

4.3 新技术下的数据容灾

一个完善的数据容灾系统的理想指标应该是RPO为“0”, RTO为“0”。新的CDP技术给这个理想带来了可能。至少在SAN存储系统上, 实现了RPO达到了“秒级”, RTO达到了“分钟级”。对于广泛使用的NAS文件共享式存储, 快照技术也实现了RPO为“10分钟”甚至于“5分钟”, RTO为“30分钟级”甚至更少。

新的数据容灾体系应运而生, 如图2。主站通过FC网络和IP网络与备站连接。SAN存储, 即常用的数据库系统的数据容灾通过CDP技术, 在主站和备站分别实现数据容灾备份。NAS存储, 即常用的文件共享式存储通过复制+快照技术, 在备站实现数据容灾备份。辅助以虚拟磁带库实现数据离线备份。在该体系中, 通过主站的CDP数据容灾备份, 可以将数据库系统数据95%以上的错误故障以RPO“秒级”, RTO“分钟级”的优秀的技术指标解决。文件级数据的错误故障的解决也可以大大优于传统容灾系统。

5 结语

核心数据在“报网融合”的今天, 是各家报社的生命之源, 发展之本。因此任何关于核心数据的项目实施与规划, 都要谨慎小心。特在此建议:

1) 数据容灾系统建设阶段, 建议部署实验环境, 多加测试。以免在实际环境部署时产生数据破坏。

2) 数据容灾系统建设完毕后, 建立切换演练机制。以免在紧急状况下手忙脚乱, 造成数据损失

3) 数据容灾系统建设完毕后, 应由专人负责定期监控其运行状况, 保证其随时可以切换使用。

参考文献

数字图书馆数据容灾技术研究 篇9

关键词:数字图书馆,容灾,数据备份

图书馆的数据容灾是指为避免灾难事故对图书馆信息服务造成影响, 在一定的技术和经济条件支撑下, 在近距离或远距离计算机运行系统的地点建立备份计算机系统、通讯设施、辅助设施以及相应的管理制度和灾难恢复程序, 以便在运行系统发生灾难时, 重新组织系统运行和恢复正常。图书馆如何有效地保存和管理数据, 预防各种突如其来的人为破坏或自然灾害, 保障系统运行的安全有效, 是现代图书馆面临的一个重要问题。

一、数字图书馆容灾现状分析

2005年4月, 我国正式颁布了《重要信息系统灾难恢复规划指南》。2007年, 国家标准化委员会又发布了《信息安全技术信息系统灾难恢复规范》 (GB/T2098822007) 。《指南》的出台, 定义了灾难恢复常用的术语, 描述了灾难恢复的管理, 进行了灾难恢复的需求分析, 规范了灾难恢复策略的制定与实现, 规范了灾难恢复预案的制定、落实和管理;而《规范》的颁布, 更好地指导了信息化系统的容灾规划和应用, 为数字图书馆的信息安全建设提供了规范和方向。

图书馆面临的数据灾难大多分为自然灾难、社会灾难和人为灾难三种。自然灾难包括火灾、水灾、地震等突发自然灾害造成的数据系统的灾难;社会灾难包括区域性电力系统故障, 意外爆炸、战争引起定点破坏等灾难;人为灾难包括IT系统管理人员的误操作、来自网络的恶意攻击、计算机病毒发作造成的数据灾难等。

目前, 国内大多数的数字化图书馆的信息系统仅仅是做了简单的本地磁盘的不同分区或者是相同系统上不同磁盘的数据备份, 不能称作为容灾系统。这些数据备份系统, 在一般灾害发生时, 可以在一定意义上保证原信息系统数据的完整性, 但很难保证信息数据的可靠性和安全性, 更不可能向用户提供透明的连续性服务。真正意义上的数字化图书馆的容灾系统, 是当一个信息服务应用点因突发事件而停止运行时, 容灾系统能够使相同的、远程的另一个信息服务点, 在无人工干预的情况下自动启动。由于容灾系统的投资相对较高, 系统的软件复杂, 对它的管理和维护困难, 致使目前国内基于数字化图书馆的容灾系统的实际应用较少。

二、数据容灾的关键技术

在建立容灾系统时会涉及多种技术, 包括存储区域网络 (Store Area Network, 简称SAN) 技术、远程镜像技术、基于SAN的网络互联技术以及虚拟存储技术等。

1. 存储区域网络 (Store Area Network, 简称SAN) 技术。

SAN是一个由存储设备和系统部件构成的网络, 其最重要的3个组成部分是设备接口 (如SCSI、光纤通道等) 、连接设备 (交换机、网关等) 和通信控制协议 (如FC、IP和SCSI等) 。这3个组件再加上附加的存储设备和服务器, 构成一个完整的SAN。SAN不仅提高了数据备份速度, 还增加了对存储系统的冗余连接, 允许独立增加存储容量, 支持高可用群集系统。当群集存储使用SAN连接时, 群集管理更为灵活, 能够使应用程序失效转移在服务器间连续进行, 使系统具有更高的可用性。

2. 远程复制技术。

镜像是在两个或多个磁盘或磁盘子系统上产生同一个数据的镜像视图的信息存储过程, 一个叫主镜像系统, 另一个叫从镜像系统。按主从镜像存储系统所处的位置可分为本地镜像和远程镜像。远程镜像又叫远程复制, 是容灾备份的核心技术, 同时也是保持远程数据同步和实现灾难恢复的基础。

3. 网络互联技术。

早期主数据中心和备份中心之间的数据备份主要是基于SAN的远程复制 (镜像) , 即通过光纤通道FC, 把两个SAN连起来, 进行远程镜像 (复制) 。这种远程容灾备份方式成本高、设备的互操作性差、跨越的地理距离短 (10公里) 等, 这些因素阻碍了它的推广和应用。目前, 出现了多种基于IP的SAN的远程数据容灾备份技术。它们是利用基于IP的SAN的互联协议, 将主数据中心SAN中的信息通过现有的TCP/IP网络, 远程复制到备援中心SAN中。这种基于IP的SAN的远程容灾备份, 可跨越LAN、MAN和WAN, 成本低、可扩展性好、具有广阔的发展前景。

4. 虚拟存储技术。

虚拟化存储技术在系统弹性和可扩展性上开创了新的局面。它将几个IDE或SCSI驱动器等不同的存储设备串联为一个存储池。存储集群的整个存储容量可以分为多个逻辑卷, 并作为虚拟分区进行管理。存储由此成为一种功能而非物理属性。因此, 存储虚拟化的一个优势是它允许异质系统和应用程序共享存储设备, 而不管它们位于何处, 用户也不再需要在每个相对独立的服务器上都分别连接磁带备份设备。

三、数字图书馆容灾解决方案

在数字图书馆的数据容灾系统中, 可以有主机型容灾、存储型容灾、虚拟化容灾及持续数据保护容灾等多种方案可供选择。

1. 主机型远程容灾是通过安装在服务器上的数据复制软件, 或是应用程序提供的数据复制/灾难恢复工具 (如数据库的相关工具) , 利用TCP/IP网络连接远端的灾备服务器, 实现异地数据复制。优点是可以不考虑存储系统的同构问题, 只要购买相关的数据复制软件, 保持主机是相同的操作系统即可;缺点是需备份窗口, 占用主机资源。

2. 存储型异地容灾是利用存储系统提供的数据复制软件, 数据流的复制通过存储系统之间传递, 和主机无关。优点是数据复制不占用主机资源, 不足之处是需要灾备中心和图书馆信息中心的存储系统有严格的兼容性要求, 给存储系统的选型带来了限制。

3. 虚拟化容灾是一种网络存储型远程容灾架构, 是在前端应用服务器与后端存储系统之间的存储区域网络 (SAN) 中加入一层存储网关, 对于I/O流量进行监控和分流, 实现异地数据复制。优点就是功能强大, 通过虚拟技术, 可以整合前端异构平台的服务器和后端不同品牌的存储设备, 本地端和灾备端的设备无需成对配置。

4. 连续数据保护 (CDP) 技术使容灾和备份二个不同的体系走向了融合。全球网络存储工业协会 (SNIA) 对CDP的定义是:一种能独立对主要数据进行持续捕捉或跟踪数据修改, 并保存变化, 从而实现从过去的任何非预设点恢复的方法。它的最大优势在于对数据的保护是连续性的, 而且可以快速恢复, 从根本上解决传统备份中低恢复能力和非精细时间策略的先天弱点。

四、一种基于因特网的容灾系统设计

对于数字图书馆而言, 基于专线或光纤通信的容灾系统价格昂贵, 而设计一款基于Internet的容灾系统, 就可以大大地降低系统的开发和维护成本。此处提出了一种基于因特网的数字图书馆容灾系统的设计架构。

1. 拓扑结构。

利用网络传输代替传统的磁带运输, 可以确保数据备份的实时性和数据的快速恢复。一旦图书馆的信息中心出现灾难, 可以利用网络上的数据对它进行恢复。该系统的体系结构主要包含两大部分:一个是图书馆信息中心;一个是远程容灾备份中心。其中图书馆信息中心的多个服务器正是通过Internet网络, 将数据集中容灾到远程灾备中心。

图书馆信息中心的数据暂存在本地服务器的缓存中, 通过Internet再将缓存中的数据逐一取出, 发送到远程的灾备中心。远程灾备中心由管理服务器、存储服务器、数据库服务器组成。管理服务器用于整个系统的配置管理, 存储服务器用于接收处理备份数据, 数据库服务器用于存储管理信息及用户备份的数据。内网主机与数据库服务器位于同一内网, 并且与数据库服务器之间的通信带较宽, 可以在线快速访问数据库服务器, 提高读写存储数据效率, 节省备份时间。

2. 功能模块。

在图书馆信息中心和远程灾备中心都包含有WEB配置管理模块、消息处理模块、状态监控模块、备份模块、恢复模块及一致性检测模块等。其中WEB配置管理模块属于用户层, 消息处理模块和状态监控模块属于中间层, 备份模块、恢复模块及一致性检测模块属于内核层。如此分层设计可以使各个模块之间相互独立, 便于系统功能的扩展和维护。

随着科学技术的发展, 容灾理论和应用系统也逐步趋于成熟, 客观条件的改善也日新月异, 特别是一些图书馆还建立了异地馆舍, 这些不断成熟的条件为图书馆异地容灾系统的建立创造了有利的条件。因此, 图书馆在建立和更新自己的运行系统时, 有必要认真地对容灾系统予以充分考虑, 怎样融合现有技术, 不断发展新技术, 构建更加安全、可靠的数据容灾系统, 以保证满足不断发展的图书馆需求, 已经成为当今图书馆界普遍关注的课题。

参考文献

[1]毕毅敏.数字图书馆信息安全与容灾[J].兰台世界, 2008 (8) .

[2]胡鹏飞.高校数字资源的容灾与备份[J].光盘技术, 2008 (11) .

数据备份策略与容灾系统方案研究 篇10

1 数据备份策略

从备份策略来讲, 现在的备份可分为三种:完全备份、增量备份、差异备份、累加备份策略。下面来讨论以下这几种备份方式:

完全备份就是拷贝给定计算机或文件系统上的所有文件, 而不管它是否被改变。

增量备份就是只备份在上一次备份后增加、改动的部分数据。增量备份可分为多级, 每一次增量都源自上一次备份后的改动部分。

差异备份就是只备份在上一次完全备份后有变化的部分数据。如果只存在两次备份, 则增量备份和差异备份内容一样。

累加备份采用数据库的管理方式, 记录累积每个时间点的变化, 并把变化后的值备份到相应的数组中, 这种备份方式可恢复到指点的时间点。

一般在使用过程中, 这三种策略常结合使用, 常用的方法有:完全备份、完全备份加增量备份、完全备份加差异备份、完全备份加累加备份。

完全备份会产生大量数据移动, 选择每天完全备份的客户经常直接把磁带介质连接到每台计算机上 (避免通过网络传输数据) 。这样, 由于人的干预 (放置磁带或填充自动装载设备) , 磁带驱动器很少成为自动系统的一部分。其结果是较差的经济效益和较高的人力花费。

完全备份加增量备份源自完全备份, 不过减少了数据移动, 其思想是较少使用完全备份。比如说在周六晚上进行完全备份 (此时对网络和系统的使用最小) 。在其它6天 (周日到周五) 则进行增量备份。增量备份会问这样的问题:自昨天以来, 哪些文件发生了变化?这些发生变化的文件将存储在当天的增量备份磁带上。

完全备份加差异备份的思想也是较少使用完全备份。比如说在周六晚上进行完全备份, 在其它6天 (周日到周五) 则进行差异备份。做差异备份时, 将会把自上星期六以来发生了变化的文件存储在当天的增量备份磁带上。

2 容灾系统的等级及实现技术

容灾是一个范畴比较广泛的概念, 广义上, 我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程, 它包括支持用户业务的方方面面。而容灾对于IT而言, 就是提供一个能防止用户业务系统遭受各种灾难影响破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性, 而不是在灾难发生后的“亡羊补牢”。从狭义的角度, 我们平常所谈论的容灾是指, 除了生产站点以外, 用户另外建立的冗余站点, 当灾难发生生产站点受到破坏时, 冗余站点可以接管用户正常的业务, 达到业务不间断的目的。为了达到更高可用性, 许多用户甚至建立多个冗余站点。

容灾系统是通过在异地建立和维护一个备份存储系统, 利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。

根据容灾系统对灾难的抵抗程度, 可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统, 该系统是对本地系统关键应用数据实时复制。当出现灾难时, 可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高, 即在异地建立一套完整的、与本地数据系统相当的备份应用系统 (可以同本地应用系统互为备份, 也可与本地应用系统共同工作) 。在灾难出现后, 远程应用系统迅速接管或承担本地应用系统的业务运行。

在建立容灾系统时会涉及到多种技术, 如:SAN或NAS技术、远程镜像技术、基于IP的SAN的互连技术、快照技术等。

衡量容灾系统的两个技术指标:RPO (Recovery Point Objective) :即数据恢复点目标, 主要指的是业务系统所能容忍的数据丢失量。RTO (Recovery Time Objective) :即恢复时间目标, 主要指的是所能容忍的业务停止服务的最长时间, 也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。

RPO针对的是数据丢失, 而RTO针对的是服务丢失, 二者没有必然的关联性。RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。对于不同企业的同一种业务, RTO和RPO的需求也会有所不同。

3 数据容灾与数据备份的联系

从定义上看, 备份是指用户为应用系统产生的重要数据 (或者原有的重要数据信息) 制作一份或者多份拷贝, 以增强数据的安全性。因此, 备份与容灾所关注的对象有所不同, 备份关系数据的安全, 容灾关心业务应用的安全, 我们可以把备份称作是“数据保护”, 而容灾称作“业务应用保护”。备份最多表现为通过备份软件使用磁带机或者磁带库将数据进行拷贝, 也有用户使用磁盘、光盘作为存储介质;容灾则表现为通过高可用方案将两个站点连接起来。

备份与容灾是存储领域两个极其重要的部分, 二者有着紧密的联系。首先, 在备份与容灾中都有数据保护工作, 备份大多采用磁带方式, 性能低, 成本低;容灾采用磁盘方式进行数据保护, 数据随时在线, 性能高, 成本高。其次, 备份是存储领域的一个基础, 在一个完整的容灾方案中必然包括备份的部分;同时备份还是容灾方案的有效补充, 因为容灾方案中的数据始终在线, 因此存储有完全被破坏的可能, 而备份提供了额外的一条防线, 即使在线数据丢失也可以从备份数据中恢复。

要保护数据, 企业需要数据备份和容灾系统。但是很多企业在搭建了备份系统之后就认为高枕无忧了, 其实还需要搭建容灾系统。数据容灾与数据备份的联系主要体现在以下几个方面:

3.1 数据备份是数据容灾的基础

数据备份是数据高可用的最后一道防线, 其目的是为了系统数据崩溃时能够快速的恢复数据。虽然它也算一种容灾方案, 但这种容灾能力非常有限, 因为传统的备份主要是采用数据内置或外置的磁带机进行冷备份, 备份磁带同时也在机房中统一管理, 一旦整个机房出现了灾难, 如火灾、盗窃和地震等灾难时, 这些备份磁带也随之销毁, 所存储的磁带备份也起不到任何容灾功能。

3.2 容灾不是简单备份

真正的数据容灾就是要避免传统冷备份所具有先天不足, 它能在灾难发生时, 全面、及时地恢复整个系统。容灾按其容灾能力的高低可分为多个层次, 例如国际标准SHARE 78定义的容灾系统有七个层次:从最简单的仅在本地进行磁带备份, 到将备份的磁带存储在异地, 再到建立应用系统实时切换的异地备份系统, 恢复时间也可以从几天到小时级到分钟级、秒级或0数据丢失等。

无论是采用哪种容灾方案, 数据备份还是最基础的, 没有备份的数据, 任何容灾方案都没有现实意义。但光有备份是不够的, 容灾也必不可少。容灾对于IT而言, 就是提供一个能防止各种灾难的计算机信息系统。从技术上看, 衡量容灾系统有两个主要指标:RPO (Recovery Point Object) 和RTO (Recovery Time Object) , 其中RPO代表了当灾难发生时允许丢失的数据量;而RTO则代表了系统恢复的时间。

摘要:容灾的基础, 是指为防止系统出现操作失误或系统故障导致数据丢失, 而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的过程。为了保障数据资料的安全, 必须进行数据备份。而一旦发生灾难, 造成大量数据丢失, 容灾系统将能保证业务尽快恢复, 甚至可以保证业务不间断执行。

关键词:数据,备份,容灾

参考文献

[1]文瑞映.ORACLE数据库的备份与恢复[J].电脑知识与技术, 2006, 23.

上一篇:生猪免疫注射下一篇:精益管理