基于存储双活技术实现高校数据中心本地高可用

2022-09-11

一、引言

近年来, 高校数据中心已逐步建立了私有云计算平台, 其具有高性能、高安全、高可靠、扩展性强、易管理等诸多优点。但是由于资金、建设时技术发展水平等多方面的原因, 很多高校的云计算平台在初期建设时往往只有单台存储或者采用了主备存储的方案, 虽然一定程度上实现了数据级容灾, 但是不能保证两台存储间数据的完全一致, 当主存储故障需要切换到备存储时, 业务也会出现一定的断线时间。随着高校对信息化各类业务系统的依赖程度越来越高, 必须尽快解决上述问题, 以保证各类业务系统数据的完整性及业务的不间断运行。

二、容灾系统及存储双活技术

(一) 容灾系统

容灾系统就是利用软硬件资源对计算机信息系统提供的应对各种灾难的环境。当计算机信息系统在发生软硬件故障或人为操作错误造成的灾难或受到不可抗的自然灾难时, 容灾系统会保护数据的完整性 (数据容灾) 以及提供不间断的应用服务 (应用容灾) [1]。评价容灾系统的主要指标为:恢复点目标 (RPO) 和恢复时间目标 (RTO) , RPO表示灾难发生时, 最大可忍受的数据丢失量, RTO表示最大可忍受的业务终止时间。数据容灾主要针对数据的安全性、完整性, 对RPO有较高要求, 而对RTO不做要求, 一般以数据备份的形式实现。应用容灾不仅针对数据安全性、完整性还针对应用的快速恢复或者持续不间断的运行。在单存储模式下, 数据中心往往采用数据备份的方式来保护数据, RPO取决于两次备份的时间间隔, 存储发生故障时, 业务要重新部署和恢复, RTO往往长达几小时到数天, 具有一定的数据容灾能力, 几乎没有应用容灾能力;在主备存储模式下, RPO取决于存储间数据复制的时间间隔, RTO取决于主备存储的切换时间, 可以缩短到几十分钟, 数据容灾能力更强, 具有一定的应用容灾能力。随着高校对各类信息系统的依赖度的增高, 许多业务系统要求数据不能丢失, 且持续不间断运行, 因此需要RPO和RTO尽量小。

(二) 存储双活

在存储主备模式下, 业务是运行在主存储上的, 当主存储故障时, 业务需要迁移到备存储, 在迁移过程中, 业务会中断, 而且主备存储之间还是有一定的数据差异。存储双活技术是解决这一问题的有效办法。存储双活, 即两台存储不分主备, 同时处理应用服务器的I/O读写请求, 面向应用服务器提供无差异并行访问能力。两台存储上的数据是无差异的, 当任何一台存储故障时, 业务由另一台存储承担, 业务不中断, 即在一台存储故障的情况下, RPO和RTO都为0, 业务任然正常运行, 具有很好的数据容灾及应用容灾能力。实现存储双活的技术主要有两种, 一种是通过同步复制技术, 配合自动化切换软件实现, 另一种是通过虚拟化存储网关或虚拟化存储设备来实现。

三、基于存储双活的数据中心本地高可用的实现

(一) 基于存储双活的云计算虚拟化平台

多台物理服务器作为计算节点构成服务器虚拟化资源池, 两台物理服务器以Oracle RAC集群形式做数据库服务器, 所有服务器向上通过两台数据中心接入交换机接入校园网核心网络设备, 向下通过两台光纤交换机连接两台虚拟化存储设备, 两台虚拟化存储设备为双活模式, 设备间均为双联路连接。平台部署华为Fusion Compuper虚拟化软件及Fusion Manager云管理软件。各类应用系统以虚拟机的形式部署在云计算虚拟化平台上。

(二) 数据中心本地高可用

在图1所示的架构中, 设备间都是双联路连接, 数据中心交换机有一台发生故障时, 由另一台提供服务, 业务不受影响, 光纤交换机也是同理。任意计算节点服务器发生故障时, 其上的虚拟机会自动迁移到其他正常运行的计算节点服务器, 业务不会受影响。数据库服务器以集群形式部署, 单台故障不影响业务正常运行。两台存储为双活模式, 两台存储设备上的LUN被虚拟化为一个虚拟的卷, 主机写操作通过卷虚拟化镜像技术同时写入这两个存储设备, 保持数据实时一致。其中任意一个存储设备故障, 虚拟卷仍能提供正常的IO读写能力, 业务不受影响。综上所述, 在基于存储双活的云计算虚拟化平台架构下, 无论网络资源、计算资源、存储资源还是数据库服务器都没有单点故障, 各类设备单台故障及单链路故障均不会影响业务正常运行, 实现了数据中心本地的高可用。

四、结语

本文介绍的基于存储双活的云计算虚拟化平台可以实现数据中心本地的高可用, 为云计算虚拟化平台上运行的各类业务提供了设备级容灾能力。本方案还没有考虑到发生数据中心级别的灾难的情况, 高校在条件具备的情况下可以建立分数据中心, 数据中心间光纤直连, 两台双活存储分别部署在两个数据中心, 以防止灾难发生时数据资产的丢失, 在条件许可的情况下, 还可建立双活数据中心, 这些都是后期需要研究的内容。

摘要:目前各高校数据中心普遍建设了自己的云计算平台, 实现了服务器虚拟化及云管理, 极大的提高了数据中心的资源利用率和运维效率, 降低了运营成本。然而, 云计算平台初期部署时, 往往采用单台存储或者主备存储的模式, 主存储故障时, 业务系统需要从备份存储重新启动, 中间有一定的业务断线时间, 及少量的业务数据丢失, 因此, 存储设备成为数据中心可靠性的瓶颈。针对上述问题, 采用存储双活技术, 实现双主存储模式, 是解决上述问题的有效方案。

关键词:存储双活,数据中心,高可靠

参考文献

[1] 宋文功, 蒋新华.高校数据中心容灾技术的探讨[J].华东师范大学学报 (自然科学版) , 2015 (3) :309-312.

上一篇:语文教师课堂教学评价的问题及对策研究下一篇:大学生公益创业实践路径研究