分布式数据库系统的设计浅析

2022-11-29

随着计算机应用领域的不断拓展和多媒体技术的发展, 数据库已是计算机科学技术中发展最快、应用最广泛的重要分支之一, 数据库技术的研究也取得了重大突破, 它已成为计算机信息系统和计算机应用系统的重要的技术基础和支柱。分布式数据库是数据库技术与网络技术相结合的产物, 在数据库领域已形成一个分支。它通常使用较小的计算机系统, 每台计算机可单独放在一个地方, 每台计算机中都有DBMS的一份完整拷贝副本, 并具有自己局部的数据库, 位于不同地点的许多计算机通过网络互相连接, 共同组成一个完整的、全局的大型数据库。分布式数据库的研究始于20世纪70年代中期。世界上第一个分布式数据库系统SDD-1是由美国计算机公司 (CCA) 于1979年在DEC计算机上实现。20世纪90年代以来, 分布式数据库系统进入商品化应用阶段, 传统的关系数据库产品均发展成以计算机网络及多任务操作系统为核心的分布式数据库产品, 同时分布式数据库逐步向客户机/服务器模式发展。

1 分布式数据库系统简介

1.1 分布式数据库系统简介

随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩充, 数据库应用已经普遍建立于计算机网络之上。这时集中式数据库系统表现出它的不足:数据按实际需要已在网络上分布存储, 再采用集中式处理, 势必造成通信开销大;应用程序集中在一台计算机上运行, 一旦该计算机发生故障, 则整个系统受到影响, 可靠性不高;集中式处理引起系统的规模和配置都不够灵活, 系统的可扩充性差。在这种形势下, 集中式数据库的“集中计算”概念向“分布计算概念发展”。分布式数据库系统应运而生。所谓分布式数据库系统是物理上分散、逻辑上集中的数据库系统, 系统中的数据分布存放在计算机网络不同场地的计算机中, 每一场地都有自治处理能力并能完成局部应用, 而每一场地也参与全局应用, 程序通过网络通信子系统执行全局应用。数据库应用的不断发展, 规模的不断扩大, 分布式数据库系统以其分布性和开放性的优势获得了人们的青睐, 在结构设计上, 它的数据力求合理必须使用的数据分布到结点上, 无权处理的数据则不能让局部用户使用。分布式数据库系统不是集中式数据库系统的简单分布, 也不是多个集中式数据库系的简单合并。分布式数据库系统与集中式数据库系统比较有以下三个主要特点:节点自主性、分布透明性、数据重复性。

1.2 分布式数据系统的分类

(1) 同构同质型DDBS:各个场地都采用同一类型的数据模型 (譬如都是关系型) , 并且是同一型号的DBMS。 (2) 同构异质型DDB S:各个场地采用同一类型的数据模型, 但是DBMS的型号不同, 譬如DB2、OR-ACLE、SYBASE、SQL Server等。 (3) 异构型DDBS:各个场地的数据模型的型号不同甚至类型也不同。随着计算机网络技术的发展, 异种机联网问题已经得到较好的解决, 此时依靠异构型DDBS就能存取全网中各种异构局部库中的数据。

2 分布式数据库系统设计

2.1 分布式数据库系统的设计原则

(1) 分布式数据库的本地性和近地性分布式数据库设计的一个主要原则是使数据和应用实现, 其最大目标是:通过尽可能地使用数据靠近使用该数据的应用进行分配, 从而提高处理的本地性来减少通信。 (2) 分布式数据的可用性和可靠性保存数据的多个副本, 使只读应用具有高度的可用性, 而且数据的任何一个副本不能使用时, 可方便地是使用在另一个站点中的该数据的副本进行恢复, 将数据分布于多个场地, 并增加适当的冗余度来提供更好的可靠性。

2.2 分布式数据库系统的模式结构

分布式数据库管理系统不仅仅是把数据存储在不同的物理节点上, 实现远程查询, 更重要的是实现透明的数据管理, 例如查询、修改、复制等。以上所有信息使得系统中的数据可以更好地组织在一起, 从而方便了数据的浏览、查询以及复制等操作;使系统的安全性和完整性得到了有力的保障使用户可以从全局的角度来操纵系统中的数据。尽管用户需要访问的数据库可能位于不同的物理节点, 但用户看到的是一个完整的统一的数据库即逻辑数据库。用户在安全规则许可的情况下, 可以很方便地访问逻辑数据库中的任何数据, 而不需关心他所需要的数据是存储在哪一个网络中, 哪一台计算机上, 使用的是什么系统, 应通过哪种方式去访问等等。这就实现了分布式数据库系统所要求的透明性。根据用户的安全级别, 系统生成数据字典的相应的用户视图分发给用户。用户视图屏蔽了系统数据字典中用户不应见到的部分, 只给出了对应于用户权限的部分数据, 从而进一步保证了数据的安全性。在分布式数据库系统中, 将关系分片, 这有利于按用户需求组织数据的分布。

2.3 分布式数据库系统的存取控制

(1) 中央集权式;将事物管理层部分放到中央节点, 将数据管理层部分放到对应的各个子节点。这种类型适用于大企业的管理方式, 如大油田或大制造厂。另外, 也可以把各个子节点上的数据管理层部分分离出来, 和中央处理机放置在一起, 各局部应用请求由各终端通过网络传递。这样便干统一进行数据管理和计算机维护, 但增加了网络的负担。这种类型是前述类型的变种, 从抽象的角度看并没有什么区别。 (2) 分层式;将事物管理层部分部分放到中央节点, 将数据管理层部分放到对应的各子节点;若各子节点还有子子节点, 则数据管理层部分的局部概念模式即为该子节点上的全局概念模式。这样的结构通常采用星形网络结构。这种类型适用于上、下级之间存在联系而同级之间又很少发生联系的纵向管理行业。如石油天然气总公司的“勘探开发数据库系统”即可采用这种结构类型。这种类型要求整个系统有高效的DDBMS支持, 否则越层的全局应用请求的响应速度就会很慢。 (3) 完全分布式;将事物管理层部分复制到各个节点, 这样每个节点均存有事物管理层部分和该节点对应的数据管理层部分。这种类型灵活高效, 充分体现了分布式数据库系统的特点, 适用于较广泛的应用方式。但这种类型的整个系统造价很高。另外还需注意, 事物管理层部分的修改特权应交给指定的一个节点, 由DDBMS支持对其余副本的修改, 以避免数据异常。

摘要:随着数据库技术的不断更新以及计算机网络通信的迅速发展, 集中式数据库系统成熟的基础上产生和发展了分布式数据库系统, 本文主要对分布式数据库系统进行简要介绍。

关键词:分布式数据库,数据,数据库安全

参考文献

[1] H.Garcia, Molina.Research Distributed Databased[J].SIGMOD Record, 1990, 19 (4) :98~103.

[2] 庄成三, 洪玫, 杨秋辉.数据库系统原理及其应用[M].北京:电子工业出版社, 2000 (6) .

[3] 习周龙.分布式数据库管理系统实现技术[M].科学出版社, 1999:305~355.

上一篇:我国农业技术推广体系问题及建议下一篇:浅析现代卧室中色彩搭配的舒适性