空间数据库网格体系构造研究

2023-01-11

1 空间数据网格的研究背景

伴随科学技术的发展, 人们对计算机计算能力、存储能力的要求越来越高。网格 (G r i d) 正是伴随着互联网技术而迅速发展起来的, 产生于科学研究与合作中的新一代计算基础设施, 专门针对复杂科学计算的新型计算模式。这种计算模式是利用互联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计算机”, 这样组织起来的“虚拟的超级计算机”有两个优势, 一个是数据处理能力超强;另一个是能充分利用网上的闲置处理能力。简单地讲, 网格是把整个网络整合成一台巨大的超级计算机, 利用互联网把广泛分布的各种资源, 包括计算资源、软件资源、存储资源、数据资源、信息资源等连成一个逻辑整体, 在动态变化的广域分布的异构虚拟组织间实现资源共享和协同工作。

网格的五个主要应用领域:分布式超级计算、分布式仪器系统、数据密集型计算、远程沉浸和信息集成。

网格最早以集成异构计算平台的身份出现, 接着跨入多个领域, 逐步形成多种类型的网格, 包括数据网格 (Data Grid) 、信息网格 (I n f o r m a t i o n G r i d) 、知识网格 (Knowledge Grid) 等。数据网格负责容纳和提供对跨组织数据的协作访问能力。

网格技术和其他技术相结合, 能够产生许多新的研究领域, 例如网格技术和空间数据相结合就产生了空间数据网格, 空间数据网格与基础网格结合构建空间信息网格。

2 网格系统体系结构分析

网格技术代表一种先进的技术和基础设施, 它基于现有因特网技术、W e b技术和高性能计算技术, 能够充分吸纳各种计算资源, 并将它们转化成一种随处可得的、可靠的、标准的同时还是经济的计算能力, 从而实现网络资源的共享和协同工作。

网格所关心的问题是直接访问随时间动态变化计算机、软件、数据和其他资源, 因此它具备解决资源与任务的分配和调度、安全传输与通信保障、人与系统以及人与人之间的交互等能力。经典的网格体系结构是五层沙漏结构, 它是一种抽象层次结构, 以“协议”为中心, 强调协议在网格的资源共享和互操作中的地位。通过协议实现一种机制, 使得虚拟组织的用户与资源之间可以进行资源使用的协商、建立共享关系, 并且可以进一步管理和开发新的共享关系。这一标准化的开放结构对网格的扩展性、互操作性、一致性以及代码共享都很有好处。

五层沙漏模型将网格划分为五层, 分别是构造层 (fabric) , 连接层 (connectivity) , 资源层 (resource) , 聚合层 (collective) 和应用层 (application) 。

五层沙漏模型中各层协议的数量是不同的, 对于最核心的部分, 由于要能够既实现上层各种协议向自身协议的映射, 同时实现自身协议向下层其它各种协议的映射, 使得核心协议在所有支持网格计算的地点都得到支持, 所以核心协议的数量不应该太多, 这样核心协议就形成了协议层次结构中的一个瓶颈, 使得模型结构呈现沙漏形状。在五层结构中, 资源层和连接层共同组成这一核心的瓶颈部分。

3 网格空间数据库系统的构建

空间数据网格作为空间数据共享与应用的技术体系, 空间数据库系统是它的一个重要组成部分。本节主要讨论网格数据库系统的基本概念、网格数据库的体系结构以及数据访问与集成服务。

3.1 基本概念

网格空间数据库系统实质上是在网格环境下的分布式的空间数据库系统, 研究网格环境下分布式的空间数据库系统的管理、协同和数据访问与共享。

W e b环境下的分布式的数据库系统一般分为分布式数据库系统和联邦数据库系统。

分布式数据库系统是在分布式环境下实现一个经典的集成库, 它有一个全局概念模式, 各个节点只能通过这个全局模式访问其它节点的数据库。分布式数据库系统为用户提供了对多个数据库的透明访问, 即用户不用指明所要访问的数据库即可获取目标数据。但在很大情况下, 由于节点的异构性, 想要构造一个全局的数据库模式是不容易的。

Internet从Web发展到网格之后, 分布式的数据库系统也相应地发展到网格数据库系统。

相对于W e b环境下的分布式的数据库系统, 网格数据库系统具有以下优势:已有数据库资源的网格化;更多组织共享使用网格数据库, 提高资源的利用率:网格数据库服务化, 使用资源更方便:通过协同工作, 提高数据库的处理能力, 完成大规模的数据库处理需求;数据库的可用性和可靠性同时提高。

3.2 网格数据库体系结构

建立网格数据库系统的基本原则是:以基于服务的方式访问已有的数据库;独立于各种数据库:与其他的W e b服务和网格服务共存:与网格认证与授权机制相衔接。

网格数据库是网格技术与数据库技术的结合产物, 它的体系结构也必然遵循网格的五层沙漏模型:构造层、连接层、资源层、聚合层和应用层。

在构造层和连接层, 网格数据库的功能与一般的网格应用没有特别的区别。

在资源层, 网格数据库通过信息协议管理资源的结构和状态信息, 包括数据库的配置 (类型、性能) 、负载和使用策略等;通过管理协议磋商对资源的访问, 包括分配、预留、监视和控制。

聚合层的功能包括:协同分配、调度及代理服务, 比如一个数据库建立多个副本, O L T P在正本中执行, O L A P在副本中执行, 提高性能, 平衡负载;数据库复制服务, 优化数据库的访问性能, 以及用于负载平衡、灾难恢复;监视和诊断、故障恢复服务;元目录服务G U S, 由多个G R I S构成。

在应用层, 通过A P I/S D K访问汇聚层和资源层的服务, 调用Grid Database Service执行交易或查询、报表、数据抽取、装载等。

空间数据网格体系结构中对网格数据库的访问属于网格数据库应用层的服务。

3.3 数据访问与集成服务

客户端Client指一个网格服务或应用程序, 在空间数据网格中指数据的请求者。客户端从网格服务注册中心获取网格数据服务工厂的GSH (Grid Service Handle) , 并向网格数据服务工厂请求网格数据服务, 网格数据服务根据客户端的数据请求从数据库中获取数据, 并将数据返回客户端。

网格数据库服务注册 (Grid Database Service Registry, GDSR) 是一个永久服务, 为网格环境下的多个用户所共享。G D S R提供GDS (Grid Database Service) 和GDSF (Grid Database Service Factory) 的专门注册服务, 属于G R I S的一个接口, 通过查询G D S R, 可发现提供特定服务或功能或数据源的G D S F和G D S。

摘要:本文基于笔者多年从事地理信息系统的相关研究, 以空间数据库为研究对象, 深度探讨了网格空间数据库的体系架构, 文章首先对空间数据网格产生的背景进行了简要的阐述, 而后分析了网格系统体系结构的组成, 最后笔者结合空间数据库的特点, 重点探讨了网格空间数据库系统的构建, 全文既是笔者长期工作实践的技术总结, 同时也是在实践基础上的理论升华成果, 相信对从事相关工作的同行有着重要的参考价值和借鉴意义。

关键词:空间数据库,网格,体系

参考文献

[1] 边馥苓, 朱国宾, 余洁.等地理信息系统原理和方法[M].北京:测绘出版社, 1996.

[2] 李德仁, 关泽群.空间信息系统的集成与实现[M].武汉:武汉测绘科技大学出版社, 2001.

[3] 龚建雅.地理信息系统基础[M].北京:科学出版社, 2001.

上一篇:在推进农村治理中加强基层党组织的领导作用下一篇:浅谈物理教师教学反思能力的培养