CGIS多源数据处理研究

2022-09-11

1 地理数据的数据范畴

GIS所含的数据均与地理空间 (位置) 有关系, 以地理坐标的形式在地表进行定位, 是一种地理参考 (geo-referenced) 数据。按其表达形式与内容性质的不同, GIS中所包含的数据可划分如下。

按表达形式可划分为空间数据和非空间数据两种基本数据类型。空间数据或称图形数据, 可分为几何数据和关系数据两种。几何数据是描述地理实体本身的位置和形状大小的度量信息, 其表达手段是坐标值.用数字形式表示空间实体, 要选择合适的空间目标类型。从几何角度可把空间目标分为点状、线状与面状三种基本类型。

(1) 点状 (0维) 目标——在空间有确定位置, 但没有长度和面积的目标, 例如孤立的点 (标定一个几何位置) 、拓扑焦点或端点。 (2) 线状 (1维) 目标——在空间有确定位置, 并具有长度的目标, 其端点由两个点状目标确定。 (3) 面状 (2维) 目标——在空间有确定位置, 并具有长度和面积的目标, 它由若干个线状目标界定。

2 地理数据的多源性及处理方法概述

地理信息系统的迅速发展和广泛应用导致了地理数据多源性的产生, 为数据综合利用和数据共享带来不便。多源性具体的体现就是地理数据使用多种数据格式记录和存储。因为GIS处理的数据对象是空间对象, 有很强的时空特性, 获取数据的手段也复杂多样, 这就形成多种格式的原始数据, 再加上GIS应用系统通常以具体项目为中心来开发, 具有很强的专业性, 因而造成了很多GIS软件都有自己的数据格式。多源数据处理的方法大致分三种:数据格式转换、数据互操作、直接读取。

格式转换是把原格式数据经过专门的数据转换程序转换成目标格式的文件并保存下来, 并将目标格式的数据作为系统所使用的直接数据源。这是当前处理多源数据的主要方法。使用格式转换方法的前提是要确知转换前后数据的文件格式。地理数据由空间信息和属性信息两部分组成。空间信息又包括空间定位信息和空间关系信息。进行地理数据的格式转换, 要确保空间定位信息、空间关系信息、属性信息三方面都能正确转换。

数据转换的缺点主要是, 由于缺乏对空间对象统一的描述方法, 从而使得不同数据格式描述空间对象时采用的数据模型不同, 往往转换后不能完全准确表达原数据的信息, 还需要人工的进一步修正和调整;另外, 当两种数据之间没有直接的转换工具时, 要借助于多种工具, 进行多步转换才能完成。

数据互操作模式是O G C (O p e n G I S Consortium) 制定的规范。OGC是为了发展开放式地理数据系统、研究地学空间信息标准化以及处理方法的一个非盈利组织。GIS互操作是指在异构数据库和分布计算的情况下, GIS用户在相互理解的基础上, 能透明地获取所需的信息。OGC为数据互操作制定了统一的规范, 从而使得一个系统同时支持不同的空间数据格式成为可能。根据OGC颁布的规范, 可以把提供数据源的软件称为数据服务器 (Data Servers) , 把使用数据的软件称为数据客户 (Data Clients) , 数据客户使用某种数据的过程就是发出数据请求, 由数据服务器提供服务的过程, 其最终目的是使数据客户能读取任意数据服务器提供的空间数据。

3 常用地理数据存储格式

地理数据存储格式可分为三类:含有空间位置信息的非地图文件、各种地图文件和地图数据库。

3.1 含有空间位置信息的非地图文件

这一类存储方式是使用通用或专用的文件格式来记录地理信息。一般为各种勘探、调查所得到的原始数据或现场观测仪器记录下来的数据文件。通用文件形式如Excel表格、TXT文本等;专用文件格式如EQT文件。

3.2 各种地图文件

地图文件是地理数据存储的重要形式, 目前得到公认的几种重要的地图数据格式有:ESRI公司的Arc/Info Coverage, Shape File, E00格式;Auto Desk的DXF格式和DWG格式;Map Info的MIF格式;Intergraph的DGN格式等等。

3.3 地图数据库形式

地图数据库普遍采用商用关系型数据库管理系统 (如SQL SERVER, ORACLE等) 统一管理图形和属性数据。用关系数据库管理图形和属性数据有两种主流方案。一种是在商用关系数据库管理系统之上开发一个中间件, 使传统关系型数据库管理系统扩充为能够管理图形数据, 如ESRI公司的Arc SDE和Map Info公司的Spatialware等。

4 多源数据处理方法

本文选择尝试将CAD格式的地图数据转换成Shapefile格式的地图文件。

Auto Desk公司的Auto CAD软件广泛应用于各个行业, 其数据文件格式DWG/DXF已成为工程图形的工业标准。一些把Auto CAD作为成图软件或使用Autodesk Map作为GIS平台的地图制作单位, 制作大量的DWO/DXF格式的CAD地图。CAD地图本身是一种矢量图形格式, 我们的任务是把CAD地图转化为更为流行的Shapefile地图格式。

对于CAD地图的处理, 要先使用地图转换工具, 然后还要辅以人工进行修正处理。在选择地图转换工具时, 首先尝试用Ar GIS中的Arc Toolbox工具进行转换。但是Arc Toolbox的转换结果有的效果很理想, 有的则丢失了很多要素。对于这一现象, 笔者从CAD地图的DWG/DXF格式入手分析, 发现图形中的一次线条能够被正确转换, 而高次线条则不能被正确转换。之后笔者又尝试了多个大型GIS平台软件中提供的格式转换工具, 发现利用Mapinfo软件中的地图转换工具不仅可以将图形中的一次线条转换出来, 而且也能将高次线条转换出来。Mapinfo的地图转换工具将CAD地图的每一层转换出来保存为一个shapefile文件。最后处理CAD地图的格式转换工具就固定为Mapinfo软件。笔者在发现Mapinfo软件对CAD地图的优良的转换能力之前, 曾给出了另一种针对CAD地图中高次线条的解决方法。该方法是在Auto CAD软件环境中对图形中的高次线条进行重新矢量化工作, 即在高次线条上描出近似的一次线条来取代高次线条。这种解决方法的思路来源于栅格图到矢量图转化的矢量化方法, 不同点在于将矢量化的操作手法应用在矢量图上。这种解决问题的思路对于以后类似的问题都有帮助。这种方法虽然能将问题解决, 但转换的结果不精确, 而且要耗费很大的人工劳动。

笔者总结出的处理CAD地图的方法如下。

(1) 使用Mapinfo软件中的格式转换工具将C A D图中的各个图层转换为线形的Shapeflle文件。 (2) 将生成的Shapefile文件中的线条分三类:表示点的线划、线形要素、面状元素的边界线。 (3) 在点的线划处描点, 建立点元素。

摘要:本文以CGIS多源数据处理为研究对象, 深度探讨了多源数据的概念范畴和数据处理方法。

关键词:城市地理信息系统,多源数据,数据处理,矢量,栅格

上一篇:浅谈高中物理的教与学下一篇:多媒体技术在教学中的应用现状及解决途径