地理信息系统元数据生产研究

2022-12-23

随着计算机技术和G I S技术发展,管理和访问大型数据集的复杂性正成为数据生产者和用户面临的突出问题.数据生产者需要有效的数据管理和维护办法;用户需要找到更快、更有效的方法,以便快速寻找、访问、获取和使用现势性强、精度高的地理空间数据。在这种情况下,空间数据的内容、质量、状况等元数据信息变得更加重要,成为信息资源有效管理和应用的重要手段。数据生产者和用户都已认识到元数据的重要价值。

1 元数据的概念

关于元数据的定义,不同组织的理解各不相同,迄今尚没有一个统一的元数据定义。但是,一般都认为元数据就是“关于数据的数据”,脱离了数据,元数据的存在也就变得毫无意义。在地理空间数据中,元数据就是说明数据内容、质量、状况和其它有关特征的背景信息和数据。

当提及“元数据”时,许多人会认为它是一个复杂的体系,仅适用于信息技术和计算机科学。实际上,元数据并不是一个新的概念,传统的图书馆卡片、出版图书的版权说明、磁盘的标签等都是元数据。元数据在地理界已用了几个世纪,早期地图和海图图廓中的图例等都是元数据,只是当我们把计算机引入该学科后,数据的管理和应用均产生一些新的问题时,才意识到元数据是使数据充分发挥作用的重要条件之一。

2 元数据的作用

面对海量地理空间数据,用户往往一时无法知道哪些数据是他们真正所需要的,数据生产者和用户之间缺乏畅通的共享渠道,而提供地理空间元数据服务的意义也正在于此,具体功能可归纳为以下几点。

(1)元数据是实现地理空间信息共享的前提条件和基本保障。只有实现了地理空间信息的收集、存储、管理、维护、发布、销售等一系列步骤的元数据化,才能真正实现海量空间数据的共享。(2)帮助数据生产者有效组织、管理和维护空间数据。可保证即便其主要工作人员调离,仍然对过去生产的数据集有较为全面的了解,这样可以实现对数据集的维护、更新,确保数据生产者对数据的持续投资。(3)通过地理空间元数据将大量零散的数据收集起来,使之成为可共享的有用信息。根据元数据中指定的数据标准、规范和格式,数据采集者、生产者、收集者可以整合不同种类及来源的数据,为用户提供有关数据生产单位、数据存储、分类、质量及数据销售等方面的信息。(4)地理空间元数据最本质的特性之一就是具有目录索引的作用,类似于一本书的目录功能。通过它数据管理人员可以用最核心的、最少的信息有效、清晰地管理海盆空间数据;同时也是用户检索其所需数据的智能导航器。

3 元数据的层次与存储方式

3.1 元数据的层次

元数据并不是孤立存在的,元数据作为数据的数据,它的内容将按照所描述的对象的不同而不同。而一个空间地理信息系统是由不同层次的对象组成的,元数据根据对象层次的由高到低可以分成为数据库级元数据、数据集级元数据和数据要素级元数据。数据库级元数据是指对地理空间数据库的描述信息,包括数据库名称、数据库类型编号、数据库内容描述、数据库访问方法、数据库更新日期、数据源描述等。数据集级元数据是描述整个数据集的元数据,包括数据集区域采样原则(指区域性数据库)、数据集标识、数据有效期、数据时间跨度、元数据形成时间、数据集的获取方法等。数据要素级元数据是指描述数据集中数据特征的元数据,包括时间标识、位置标识、量纲、误差标识、数据处理过程等,它是面向每个数据项、每个数据记录的。

3.2 元数据的存储方式

显而易见,不同层次的元数据存储方式是有差异的,例如描述数据库的元数据应该随数据库存在,且由建立在分布式网络数据库管理系统统一管理;描述数据集的元数据可以随数据库存在也可随数据集存在;描述数据特征的元数据只能随数据集存在。分散管理是以数据集为基础,即每一个数据集有一个对应的元数据文档,每一个元数据文件中包含对相应数据集的元数据内容,如美国U S G S提供的空间元数据均采用这种形式,这种方法的优点是元数据和数据的关联性较好,缺点是元数据文档太多,不便于管理。分散式管理的存储比较灵活,可以采用非结构化的文本记录方式和结构化的数据库记录方式。这种方式要求的计算机资源较少,适用于记载数据项不复杂、使用不频繁的元数据。集中管理是以数据库为基础,即一个数据库只有一个元数据文档,文档中的每一个记录对应于一个数据子集,这种方法的优点是管理方便,增删和修改容易,缺点是必须有一种技术机制进行统一管理。

与文本方式等非结构化的记录方式相比,结构化的存储策略有利于充分发挥关系数据库系统的数据输入、查询等。

4 元数据的内容与标准

4.1 标准化的必要性

早期因为没有考虑元数据的共享,各部门分别制定自己的元数据内容,引起了元数据内容的不同。唯一能够在不同数据管理软件间交换元数据的途径是统一元数据标准。元数据标准能够使数据生产者和用户一起着手处理有关元数据交换、共享和管理的问题。元数据标准描述了为了实现数据维护、数据共享、查询和传输等功能,需要什么内容的元数据。

4.2 地理信息元数据标准发展现状

随着地理信息元数据重要性日益突出,全世界的许多国家、国际学术团体和公司都在研究和制定与其密切相关的地理信息元数据内容与标准。目前,一些国家、行业、国际组织已建立了自己的元数据标准,例如美国的F G D C的元数据标准等,但或多或少都存在一些问题。我国也在近几年制定了“中国可持续发展信息共享元数据标准”等。但是这些只是形成了一些区域性或部门性的标准,仍没有一个标准可以成为各级地理信息元数据的统一标准,同时形成不了一个统一的元数据库框架结构。另外,由于元数据的内容涉及到各行各业的各个方面,所以不可能出现一个能让大家都遵循的元数据标准,即使在地理学有了这样的标准,但大家在具体组织数据时有着不同的应用背景,在最终元数据的内容上并不一定和标准完全一致。

(1)中国可持续发展信息共享元数据标准。

在我国尚未制定元数据国家标准的情况下,根据中国可持续发展信息共享示范系统总体设计的要求,考虑到参加该项共享的数据库内容与类型,参考有关国际先进标准,制订了项目内使用的《中国可持续发展信息共享元数据标准》圈。该标准的元数据内容主要包括:数据基本信息、数据质量信息、数据志信息、空间数据标识信息、参照系统信息、要素分类信息、发行信息、元数据参考信息等。

(2)其他元数据标准。

除了上述元数据标准外,国内外还有许多机构或部门根据需要制定了或正在制定具有自己特色的元数据标准,如欧洲地理信息标准化委员会(CEN-TC287)的CEN地理信息—数据描述—元数据、美国国家航空与航天局(N A S A)的目录交换格式英国都柏林的核心元数据标准、北京大学遥感与G I S研究所鉴于我国N S I的元数据标准、中国资源环境区域信息系统元数据标准等。这些标准都具有一定的区域性,在不同的范围内使用,在解决某些具体问题时有各自的优势。

摘要:本文基于笔者多年从事GIS数据制作的工作经验,以元数据生产为研究对象,深度探讨了元数据的概念、作用、存储方式、内容和标准,是对元数据生产的一个较为全面的诠释,文中的一些方法也是笔者工作实践的总结,相信本文的研究对从事相关工作的同行有着重要的参考价值和借鉴意义。

关键词:地理信息系统,元数据,标准,方法

上一篇:坚硬厚层顶板弱化前后采场矿压显现规律研究下一篇:新形势下企业思政建设的革新路径分析