数据交换与共享平台建设

2024-05-08

数据交换与共享平台建设(通用7篇)

篇1:数据交换与共享平台建设

顺德区数据交换与共享平台建设(SD09050)

采购内容及技术要求

一、现状

我区于2005年开发完成数据共享和交换平台,并于2008年对系统进行更新升级,进一步完善了系统的功能。平台目前运行在区信息中心机房,有公安局、计生局两个节点与之相连,运行正常。

二、建设目标

本项目建设目标是:调研业务部门的数据共享需求,编写《广东省顺德区数据共享规范与接口标准》和《顺德区政府资源目录》;开发和完善数据共享平台系统;建设顺德区数据共享资源体系,推进数据的共享和综合开发利用;实现顺德区各部门信息数据共享和互联互通,使数据共享平台成为电子政务建设的支撑和服务平台。

三、建设内容

本次建设内容分为三部分: 1)对政府重要职能部门开展调研

完成对12个政府重要职能部门数据集成方面的需求调研,完成以数据共享、交换和整合需求的梳理和分析。

2)数据共享规范与标准接口和政府资源目录建设

通过调研业务部门之间的数据共享需求,编写《广东省顺德区数据共享规范与接口标准》和《顺德区政府资源目录》,并逐步完善。

3)数据共享平台开发和完善

提供数据发布、目录维护、系统配置等界面,增强系统易用性;改善数据传输性能,支持不同级别数据量的应用系统的数据传输;集成数据共享申请、申请审核、数据共享目录编制等业务功能;实现全区、区与市之间的数据共享;增加共享数据分析统计功能,监控共享数据的访问量、数据状态、共享数据业务办理状况等。

第 2 页,共 14 页

四、建设原则

(一)开放性

数据源和目标数据可以是文本文件、Excel文档、Word文档、XML文档。通过JDBC、ODBC支持所有JDBC和ODBC数据库,并为部分主流数据库提供了专用的数据库接口。目前应该满足Sybase、Informix、Oracle、DB2、SQL Server等异构数据库双向数据传输的需求,根据实际情况还可以进行扩展。

整体开发遵循J2EE平台标准和XML交换标准,有良好的平台兼容性。可以应用于Windows、Linux和Unix系统。

(二)安全性

数据中心的安全非常重要,因此必须要做好系统的安全设计,防范各种安全风险,确保数据中心能够安全可靠的运行。同时数据中心必须采用成熟的技术和体系结构,采用高质量的产品,并且要具有一定的容灾功能。

(三)实用性

完善友好的定制开发环境支持不同技术层次使用者的使用要求。安装简易,使用简单,有完善的系统参数配置工具和管理控制台。

(四)可伸缩性

可以合理地定制数据共享交换方式。根据不同类型业务特色和技术要求特点,量身定制相应的数据交换解决方案。

(五)可扩展性

能够方便的加入交换节点以及增加交换共享服务。能够根据需要,通过增加硬件配置的方式对交换平台进行扩容。

(六)相对独立性

根据数据共享平台的目标定位,数据共享平台的建设和运作必须保持业务系统的相对独立性。为此采用松散耦合方式,通过在业务部门统一配置部门端数据共享交换管理系统(代理)实现数据资源整合。

第 3 页,共 14 页

(七)统一建设

数据共享平台必须统一规范建设。通过制定统一的数据共享与交换标准,建设统一的数据共享交换平台,即中心端数据共享交换管理系统和部门端数据共享交换管理系统(代理),可以避免重复投资,降低接口的复杂性,有效实现数据中心与业务部门的数据共享与数据交换,消除 “信息孤岛”,实现数据资源的互联互通。

(八)共建共享

一方面建设数据共享平台的目的是为了实现业务部门之间的数据共享和交换。另一方面,数据中心的数据来源于各个业务部门,因此数据共享平台的建设必须依靠各业务部门的积极参与和配合

五、关键技术

数据共享平台的技术路线要点描述如下:

1、采用XML技术统一数据交换格式,使用XML Schema进行数据标准规范的定义和描述。

2、采用SOAP协议进行信息包的封装和数据路由。数据共享与交换平台考虑对Web服务的支持。

3、采用消息中间件保障数据传输的可靠和完整。

4、安全方面,利用XML实现数字签名和加密,并与CA平台结合。通过并发访问控制、访问代理、数据校验、安全审计等手段保证共享数据的完整性、安全性。

5、管理方面,采用WBEM收集、管理并合并多种来源的管理数据。对数据共享平台的各个组成系统进行有效管理。

6、所有支撑系统基于统一的技术平台上设计开发。

7、采用存储域网络(SAN)架构实现共享数据和备份数据的存储。

8、采用集群技术和负载均衡技术提高系统的整体性能和可靠性。

六、调研要求

1、调研对象

第 4 页,共 14 页 调研的对象是顺德区政府下属的重要职能部门,主要包括:工商局、公安局、地税局、国税局、社保局、国土局、计划局、技监局、建设局、民政局、经贸局、执法局等。

2、调研结果

通过对调研原始数据的分析,得出如下调研结果: 1)各个部门的数据供需关系 2)各个部门业务系统状况 3)各个部门软硬件设备状况

4)各个部门对数据共享平台的共享数据的需求

七、《顺德区政府资源目录》和《顺德区数据共享规范与接口标准》

政府资源目录建设的目的是编写《顺德区政府资源目录》,通过调研,收集各个业务部门的之间的跨部门共享数据的供需关系,以及各个部门目前对外共享数据的能力,了解各个部门对数据共享平台共享数据的需求,结合国家对四大数据库的要求和顺德的实际情况,抽象出公共数据库模型,为建设四大基础数据库打下基础。

《顺德区数据共享规范与接口标准》是由一系列的规范、机制、制度组成。标准规范体系包含数据标准规范、技术标准规范、管理标准规范、业务标准规范等4大部分。在设计标准规范体系的时候,需要从体系结构的角度全盘考虑,在符合或者兼容国家电子政务标准规范或上级部门的标准规范的基础上进行设计。

以下标准规范体系图为参考方案,投标方如有更完善的标准规范方案可具体说明整体的体系结构。

第 5 页,共 14 页

数据标准规范

数据标准规范包括:公共数据元标准、公共代码标准、公共数据存取规范、数据交换规范。

技术标准规范

通过技术标准规范支持业务部门系统和数据共享平台之间的数据级和应用级整合,并提高业务系统之间的应用集成、互联互通的能力。

管理标准规范

管理标准规范包括:标准管理、安全管理、数据管理、项目管理,用于指导数据中心日常运行管理、数据维护管理。

业务标准规范

独立的业务标准规范由业务部门制定,关联业务标准由数据共享平台统筹,协调各业务部门联合制定。

八、数据共享平台建设

数据共享平台得建设分为以下三大部分:

第 6 页,共 14 页 1)政府资源目录平台

管理《顺德区电子政务资源共享目录》的内容。包括以下功能:目录接口定义和实现;目录管理和维护;目录访问。

2)前置机处理系统

实现对各个业务部门(不少于5个)不同数据库、不同业务数据资源的统一共享和访问。包括以下功能:系统配置;系统安全管理;数据共享接口定义和实现;数据共享规则定义;数据同步复制。

3)资源目录管理平台

实现政府工作人员共享数据、发布数据、监控管理的统一入口和功能。具体内容包括:完善系统现有功能;增加系统统一监控功能;增加数据库自动推送与接收功能;简化部门前置机的安装和配置;将系统配置功能在统一的Web管理端上实现;实现与佛山市数据共享和交换平台的无缝对接。

第 7 页,共 14 页

数据共享交换平台应实现如下功能:(1)节点管理

实现与数据共享平台相连的的各个节点(业务部门)的信息管理、配置管理。(2)主题管理

数据采集、数据发布、数据共享、数据交换、公共服务以及决策支持均以主题的方式进行,因此必须实现对主题的管理。主题是元数据的集合。

第 8 页,共 14 页(3)元数据管理

元数据(Metadata)是关于数据的数据。元数据描述了数据的结构和意义,同时也可以描述应用程序和流程的结构和意义。构造数据共享平台数据库的重要步骤之一,就是定义和创建元数据。所有进入数据共享平台的数据,必须在元数据中有所表述。数据共享平台的数据管理系统必须提供储存和管理元数据的方法。

数据共享平台的元数据包括基础数据元和共享数据元,由数据共享平台统一管理。基础数据元由数据共享平台定义,共享数据元由业务部门定义并注册到数据共享平台。业务部门进入数据共享平台的元数据管理中心好比进了一个“超市”,可以方便地知道可以获取和使用哪些数据,并进行数据使用申请的定制。(4)公共代码管理

对公共代码需要有统一的标准规范,数据共享平台必须提供公共代码的管理。基于数据中心的公共代码规范,各部门可以通过数据转换将各种不同含义的编码和标准规范的编码之间进行双向的转换。(5)数据采集

与各业务部门形成数据采集机制,通过数据共享交换平台从各业务部门汇总数据,对原始数据进行缓存、存储。(6)数据同步策略管理

系统应能灵活设置和管理数据的同步策略,支持异地、异构、不同组网方式、不同时间间隔等同步策略功能,能结合调研结果和招标方的最终实施方案进行部署,能灵活配置各部门的业务数据库和数据共享平台的公共基础数据库的数据同步,实现数据透明同步和更新,保证数据的一致性。(7)数据整理比对

从各业务部门采集共享数据后,进行数据转换,数据比对、冲突检测处理并入库。(8)数据交换

实现业务部门与数据共享平台之间的数据交换业务,形成高效、安全、可靠、稳定

第 9 页,共 14 页 的数据交换网络。应提供定时批量、实时按需等多种方式的数据交换手段,提供点对点、一对多的数据交换支持,对数据交换进行管理和监控。(9)恢复管理

恢复管理是对数据进行备份、导入导出以及数据库恢复等。数据是数据共享平台核心的资源。全面的容灾方式应该是数据备份+数据复制+远程容灾。对系统中的数据要定期进行系统备份。采用本地备份与异地备份相结合的方式。投标方应具体说明采取何种方式实现该功能。(10)标准管理

进行数据共享平台的标准规范尤其是数据标准的审核制定、升级维护与发布实施等管理功能。在数据中心的建立之初,由于标准规范处于不断完善的过程,应建立标准的版本管理机制,方便业务部门的查询和使用。(11)应用支持

对政务相关业务应用系统、公共服务系统、联合审批系统、业务监管系统和决策支持系统提供数据、通道和平台等支持。(12)运行管理

运行管理系统主要提供给数据共享平台的系统管理人员使用,用于保证数据共享平台的安全可靠和高效运行。其功能主要包括面向安全性的用户管理、权限管理、密码管理和日志管理等;面向性能优化的性能监控等。面向实用性的节点管理、交换规则管理和状态监控;其中节点管理包括对业务部门的信息管理。

由于各种共享数据由不同的部门提供和使用,为了提高数据的使用效率,必须提供数据统计和分析功能,首先要对共享数据的访问日志进行记录,然后灵活地统计各个部门共享的数据以及访问过的其它部门的共享数据,同时将这些结果汇总,进行各种分析,提高数据的使用效率。

数据共享平台是一个分布式业务处理平台,由多个设备和软件同时运行,为了保证整个平台的高效率运行,必须监控每一台设备上每一种应用程序的运行状态,数据访问流

第 10 页,共 14 页 量,以及共享数据业务的办理状况,一旦发现异常,立即报告管理人员采取有效措施,恢复系统的正常运行。

这些功能的设计,首先是标准的监控状态信息格式定义,然后是被监控设备上软件的技术实现,最后是数据资源管理平台对被监控设备上软件的状态信息的动态查询和显示。

(13)数据共享申请管理

此功能包括以下三个功能点: 1)数据共享申请:提出数据共享申请 2)数据共享申请审核:对共享数据进行审核

3)数据共享目录编制:对于审核通过的数据共享申请,对所共享的数据进行编目和发布

一个业务部门想要其他部门共享数据,首先要向其他部门提出申请,由其它部门对数据共享申请进行审核,如果审核通过,则对共享数据进行编目,其它部门就可以对想要的数据进行访问了,若审核不通过,则数据不共享。(14)数据交换网关

数据共享平台的建设,解决了数据共享和交换的问题,实现了政务信息的互联互通,但是由于UDDI规范比较复杂,而且,开发一个应用系统需要与多个业务部门打交道,因此,开发效率比较低。而数据交换网关,能够很好地解决了这个问题。

如“错误!未找到引用源。”所示,数据交换网关,是一个基于数据共享平台的数据共享和交换服务提供平台,该平台引入了数据服务的概念,在定义数据服务的基础上,屏蔽了UDDI规范的细节,通过数据服务中的业务系统名称,屏蔽了整个数据共享平台中的各个接入部门,使得应用系统的开发人员只需要和数据交换网关打交道,再也不需要和各个业务部门打交道了,大大提高了开发效率。

数据交换网关提供简单的、标准化的数据共享和交换接口,在接受应用系统提交的数据共享和交换请求以后,通过所定义的数据服务,找到所要共享和交换数据的业务系统,第 11 页,共 14 页 然后由数据交换网关从政务信息资源目录中获取数据共享和交换接口,向业务部门发出调用请求,最后将调用结果返回给应用系统,实现了数据共享和交换请求的智能路由。

对于公共数据库,共享文件库等,可看作一个特殊的业务部门,也通过数据交换网关实现数据操作。

领导综合社会保障城市综合地理应急指挥决策支安全责任技术交易市其他应电子监察查询系统服务系统信息服务系统系统持系统管理系统场管理系统用系统Web Service接口:XML, SOAP数据交换网关服务管理服务定义服务取消服务检索远程服务注册管理安全管理用户管理权限管理服务安全管理系统安全管理系统监控访问监控流量监控操作监控线程监控请求中转和路由日志管理统计分析数据加密/解密Web Service接口:XML, SOAP部门前置机政务信息资源目录WSDL格式接口信息公共数据库部门前置机部门前置机部门前置机人口数据库法人数据库宏观经济数据库地理信息数据库

九、与CA安全认证平台无缝集成

系统安全可靠性要求

数据共享平台是电子政务的核心系统,如果遇到破坏,或无法正常工作,将造成无法估量的损失。需要保护的资源不仅有物理资源(设备、设施)、数据资源(数据、数据库软件等),而且还有网络资源(通信链路、网络接入等)。投标方应具体阐述这方面的实

第 12 页,共 14 页 现方案。

数据安全保密性要求

满足在数据存储、传输过程中的安全保密性要求。电子政务中涉及大量的敏感数据,在其处理过程中,特别是与各级单位数据交换过程中,要进行数据加密传输和存储,要保证数据的安全保密性。

数据完整性要求

满足在数据存储、传输过程中的完整性要求。在内部要保证数据存储和传输过程中不被篡改和破坏,在与各级单位数据传输的过程中,要保证数据不被篡改和破坏。

实体的可鉴别性要求

满足数据共享平台系统对用户及数据交换服务器的可鉴别性要求。系统要实现监管及其他方面的要求,其必要条件是实现实体的可鉴别性,包括用户及数据交换服务器具有可鉴别性等。

不可抵赖性要求

满足数据共享平台用户行为和系统行为不可抵赖性的要求。用户每天都利用数据中心处理大量的事务,事务处理过程的可管理、效率的可审计、行为的可审计等,需要行为的不可抵赖性来解决。本项目建设中要保证在所有数据处理过程中,办公人员行为和系统行为的不可抵赖,以便审计和监督。

对象和行为的可授权性要求

实现对数据资源的自主授权和访问控制的功能。针对电子政务系统数据交换共享工作的特点,要求数据中心具有对对象灵活授权的功能,包括用户对用户的授权、系统对用户的授权、系统对系统的授权等,以及授权过程的审计监督。

统一信任与授权策略要求

对于涉及30多个业务部门、若干业务系统的数据中心而言,安全性的实现不仅体现在各个部门、各个业务系统中,更重要的是在不同业务部门的不同系统实现互联后。为了保障数据、业务系统在互通后的信任、授权的一致性,必须建立统一的信任策略、授权策

第 13 页,共 14 页 略,实现跨部门、跨系统的信任和授权服务的一致性,杜绝由于不同部门、不同业务系统不同的安全策略、不同的安全等级带来的安全漏洞和安全隐患。

数据共享平台统一安全监管性要求

由于数据共享平台及其部门端系统分布地域广、涉及政府多个部门,因此需要实现数据交换、共享过程的可管理,实现对内部和对各级单位相关的业务处理的可审计性;系统中有大量的数据交换服务器、维护终端、系统软件、网络设备等,为使这些资源协同工作,需要实现对实体(用户或数据交换服务器)进行统一的管理;系统需要对用户行为和系统行为进行记录和统计,对系统日志进行分析和统计,提供对用户和系统行为的审计监督。这种统一的安全监管必须以可靠的技术和严格的管理来保证。

软件及技术资料要求

1)软件要求为模块化结构,保证安全可靠,具有容错能力。

2)投标方提供的软件应能满足确保本系统正常运行所需的管理、运营、维护等有关的全部软件。

3)兼容性及升级。不同时期软件版本应能向下兼容,软件版本易于升级,且在升级的过程中不影响网路的性能与运行。投标方应承诺在供货时提供最新版本的软件, 但该软件必须是经过测试正式推出的, 其可靠性、稳定性经过严格验证的。

4)投标方提供的书面技术资料应能满足确保系统正常运行所需的管理、运营及维护有关的全套文件3套,光盘1套。投标方应提供书面技术资料详细清单,提供的技术文件至少应包括:

- 系统说明文件

- 技术手册(需求分析、详细涉及、安装、测试、使用、维护、故障排除等)- 软件原代码

合同主要条款

1、完工期:合同签订生效后180天内平台建设调试完毕、验收合格并交付使用。

第 14 页,共 14 页

2、付款方式:

1)合同签订生效后15个工作日内付合同总价的30%;

2)无违反合同约定的,软件全部交付使用、验收合格后15个工作日内付合同总价的65%;

3)无违反合同约定的,余款(即合同总价的5%)在免费升级维护期满后30个工作日内付清。

3、售后服务:

1)免费升级维护期:不少于1年,在验收合格后开始计算。

2)响应时间:即时响应;4小时内到达现场(如电话响应无法解决); 3)修复时间:免费升级维护期内24小时内解决。

4、培训:1)培训地点:使用单位内培训,培训人数不少于3人。

2)培训基本内容:确保用户能够对软件有足够的了解和熟悉,能够独立进行应用系统的日常运营、维护和管理。

以上合同主要条款为基本要求,投标人参加投标,则视为接受上述要求。投标人可在此基础上作出优惠承诺,以提高其投标的竞争力。

第 15 页,共 14 页

篇2:数据交换与共享平台建设

在统一标准的前提下,构建统一的数据共享与交换平台,通过异构应用整合各类业务系统(民政、计生、劳动、综治、统计等),有效解决各“条线”系统间的互联互通,实现各种信息资源的整合和共享,以改善社区公共服务的方式和方法,提高社区服务和综合管理水平。

具体做法:

(1)有效利用存量数据。

(2)增量数据的管理。

(3)实现应用系统有效整合和资源共享

篇3:数据交换与共享平台建设

关键词:企业服务总线,数据共享与交换,面向服务架构

电子政务在多年的发展过程中, 已经取得了一定的成果,在设施建设方面得到了很大的完善, 但在一些公共服务信息系统设计方面仍存在很多问题, 仍未实现信息资源 的共享 ,建设力度远远不够, 引发严重的信息孤岛问题, 影响政府办公系统中业务和信息的处理效率。本文通过基于企业服务总线的数据共享与交换平台的设计研究, 为电子政务逐渐向着面向服务、规模应用的方向发展提供给术研究基础, 从而达到提高电子政务系统工作效率的目的, 为相关研究提供参考意见。

1 概述

1.1 ESB 架构

建立在面向服务的体系结构 (SOA) 基础之上的企业服务总线 (ESB) 本质上属于电子行业设备应用集成模型, 其内部集成式软件构件具有紧密的联系, 相互影响和作用。面向服务的体系结构的组装和集合是构建ESB的前提, 包括多种功能元件, 能够满足不同层次目标的要求。

1.2 ESB 特点

在面向服务的体系结构下, 企业服务总线可以实现企业应用的集成。ESB特点体现在事件驱动、面向消息和面向服务3个方面, 其中, 在不同应用间进行的消息接收、产生均属于事件驱动, 面向消息及服务则分别指的是利用ESB进行消息的接收/发送和重复利用服务组合而成的分布应用[1]。

由Web服务、可扩展标记语言及中间件技术共同构成的ESB, 可以起到传递企业应用信息数据的作用 , 改进了传统的传输模式, 在性能上具有显著的优势。在企业构建数据共享与交换平台的过程中, 应用ESB技术可以大大降低成本的投入, 避免了因应用技术差异较大而导致的服务不统一的问题。

1.3 ESB 功能

在研究技术不断完善的过程中, ESB具备的功能逐渐增多, 这些功能的发挥能够以开放标准或专项技术为基础, 主要涉及消息处理、建模、集成、通信、 安全、质量服务和服务交换等。但不同技术的综合运用也可能会带来潜在的问题,例如 : 采用标准 不一致、 技术安全 和灵活程 度差异大 等[2]。ESB核心功能简介如下 : (1) 服务交换。可实施替代服务 ,可以高效地完成应用服务代码的提取工作, 具有一定的开放性特点;(2) 集成。能够使适配器、Web服务和Java2连接器等不同集成方法正常运行;(3) 通信。应用普遍性的传输协议, 通过进程间通信的重要途径, 管理命名服务、网络服务寻址, 将有关位置透明性的寻址服务、路由的信息进行收集。

1.4 ESB 的组成及适配器技术

适配器组 件、管理 控制组件 、转换组 件及通信 组件是ESB的关键组成部分 , 在发挥连接 应用系统 功能的过 程中 ,需要借助适配器技术, 从服务组件、应用及数据库系统等方面实现整合系统与被整合系统应用的统一。多种连接方法为应用系统的联系提供了技术保障, 其中数据库连接、开放数据库互连为应用数据库系统的连接提供了标准规范。ESB的架构图如图1所示。

为了保障系统的高效连接而研制的适配器, 可以使多种系统的接口整合为一个, 并在此基础上实现业务数据的交换,减少了系 统数据传 输的繁琐 性[3]。ESB适配器技术的优 势如下: 改善面向对象、以组件为基础的模块网络应用性能; 提升数据相关操作和处理的工作效率; 将应用系统同管理系统的连接、数据共享变为现实, 可以管理各项事务。

2 信息共享交换平台

2.1 平台的层次结构

用户交互层→流程整合层→应用整合层→应用接口层→信息系统基础设施是组成数据共享与交换平台的5个层次结构,流程整合层又分为业务间整合、业务行为监控和业务流程管理, 而应用层又包括消息路由、数据转换及数据格式定义。

应用接口层是数据共享与交换平台构建的基础, 该平台需要在信息系统基础设施的支持下发挥作用, 可以针对系统间的数据传输提供解决路径。应用整合层作为应用接口层的上一级, 尤其适用于整合系统应用数据信息转换方面, 企业系统数据的应用都应通过该层的数据模型来完成。二者的上一层次为流程整合层, 是确保不同系统高效运作的重要前提,可以整合不同系统, 具有管理业务流程、设计流程、监管控制流程等多项功能[4]。位于数据共享与交换平台的最高层次是用户交互层, 主要面对的广大用户, 使用户能够进入应用系统中, 满足不同用户的需求。用户交互层可以对系统内、外部的信息进行融合。企业服务总线技术在流程整合层及以上层次结构占据着较高的地位, 提供了坚实的技术保障。

2.2 平台功能

数据共享与交换平台的功能包括多种内容, 如:(1) 连接和运行各种数据库, 通过适配器的作用, 对系统进行全面的管理;(2) 建立在可扩展标记语言 基础上的 集成服务 模式, 高效传输应用系统及业务间的数据信息, 结合实际需求,对系统应用功能进行优化配置;(3) 包含测试、监管控制、动态观察和整体部署等功能, 实现远程管理控制;(4) 平台互用性较强, 可以发挥传递数据、数据定位、数据包封装的作用, 根据相关标准, 整合多种应用系统的整合;(5) 转换多种数据格式, 如: 可扩展标记语言同文本文件间 的转换、可扩展标记语言同其他可扩展标记语言间的转换、 短消息服务同可扩展标记语言间的转换等。此外, 还能利用不同的函数关系, 映射异构数据[5]。

2.3 平台架构

就企业中基于ESB的数据共享与交换平台的管理原则来说, 其属于一种集中、统一式的管理, 但在运行角 度来看 ,则归为分布式运行的范畴, 平台架构的设计和实现参考的原则为松耦合原则。应用系统平台包含着大量的节点, 不同节点的自身运行环境相对独立, 均支持数据集成、服 务交换 ,在应用系统的大环境下, 这些节点能够通信联系, 承担着服务总线系统负载。

如图2基于面向服务的体系结构的企业服务总线体系架构所示, 在中央服务器的统一约束管理下, 企业服务总线服务网络呈现分布式的特征, 共包括6大部分, 都是由多个节点整合而成。各层功能独立而统一, 既确保了自身系统扩展性, 同时也存在协作关系, 共同实现企业业务需求。

3 数据共享与交换平台系统实现

3.1 集中式的服务总线的管理

各节点适配器、运行环境的管理均利用的是JMX (JavaManagement Extensions) 技术 , 适配器及SOA解决方案的分布式JBI (Java Business Integration) 环境的管理控制阶段位于企业服务总线体系架构核心的中央服务层, 应用标准为JMX。集中管理层、代理层及设备层是组成JMX代理服务的基本模块, 不同应用层中分布的节点, 可以将涵盖所有注册MBean的仓库、JMXUrl进行连接, 获取有关管理对象的数据信息 , 并向MBeanServer发出一系列的执行命令 , 最终落实和完成相应的操作。

3.2 日志管理

具备日志收集服务功能的数据共享与交换平台, 在Java日志框架的支撑下, 通过多种管理工具, 向用户提供大量的日志信息, 并采取嵌入式数据库的途径, 将不同种类的日志进行存储和管理, 在系统伸缩性方面具有独特的优势, 避免了企业服务总线争用的问题。在当前应用系统中, 开放源码的嵌入式数据库的程序库有着极其广泛的应用, 方便了工作人员和用户进行管理和操作, 性能更加优化[6]。通过设置日志记录表的途径, 可以在平台数据库中对日志的内容、时间和级别进行记录, 还可以查询到日志创建者的网络之间互连的协议。

3.3 节点

各节点运行环境均符合分布式JBI规范要求, 允许适配器组件的接入和运行, 大量节点在基于ESB的数据共享与交换平台中的位置对等, 平均承担着系统总负荷, 大大提高了节点资源的管理和应用效率。

3.4 适配器

数据共享及交换平台的功能实现, 依靠的关键部件就是适配器, 适配器种类繁多, 是应用系统功能整合的根本所在。适配器实现技术包括DBIn、DBOut, 二者均属于数据库适配器, 前者具有接受、解析数据信息的作用, 能够将可扩展标记语言形式的信息转化为结构化查询语言形式, 并执行Sql语句; 而后者根据数据库应用记录查询相应的操作, 进行实时性的监测和控制, 实现数据增量抽取。

4 结语

篇4:数据交换与共享平台建设

关键词:数据共享;数据交换;大数据;数据可视化

中图分类号:G642.0 文献标志码:A 文章编号:1673-8454(2016)19-0048-05

一、引言

近年来,随着信息技术产业的蓬勃发展,高校的信息化建设工作也受到了广泛关注。推进高校信息化建设,打造数字化校园已成为各高等院校的普遍共识。2010年,我校完成了数字化校园建设信息门户平台、统一身份认证平台和统一数据库平台“三大平台”建设。由于信息化建设初期缺乏统一规划,数据标准各异,业务系统各自为政,导致数据非集成化并形成了许多的信息孤岛,这使得大量优秀数据无法共享和利用,获得更大价值。我校于2014年又进行了数据共享交换平台的建设。该平台是整个数字化校园建设的重要组成部分,利用此平台对校园内散乱分布的数据进行集成化整合,同时将原来分散、利用率低下的信息资源进行数据挖掘,对于我校的发展战略和决策支持具有重要意义。

二、发展现状

我校从2006年开始着手进行信息化校园建设工作,整体建设历程具有阶段性和分布性的特点。按照《信息化校园建设总体规划》的部署,截至2010年,学校信息化基础设施建设已基本完备,并完成了信息门户平台、统一身份认证平台和统一数据库平台三大公共基础平台的建设。

2012年1-6月,我校完成了应用系统一期项目建设,包括本科生管理服务、研究生管理服务、人事管理服务和办公自动化管理四个系统;至2013年12月,我校完成了應用系统二期项目建设,包括招生管理、宿舍管理、毕业离校、就业管理等七个系统,同时集成了教务管理系统和资产管理系统。

2014年至今,通过对基础平台和应用系统的完善推广,我校将管理信息系统建设作为支撑学校管理现代化的基础,现基本完成对学校各机关部处、教学教辅部门的核心管理业务的横向整合。

统一数据库平台负责集中存储和处理各种信息数据,并为全校提供信息共享交换服务。为了实现业务系统的集成和数据共享,进而为学校领导提供有力的决策支持,需要建立基于数据管理和综合性技术方案的数据共享交换平台,在对大量数据进行安全存储的同时,通过建立畅通的数据访问通道,能够有效协同地将数据进行共享、分析及应用,保证数据共享及交换的时效性、完整性和一致性。[1]

数据共享交换平台主要需完成以下任务:

1.数据的采集

负责采集更新各业务系统数据,利用数据抽取或同步工具将数据采集至共享数据中心,同时生成数据更新报告。

2.数据的整理

按照学校制定的信息化标准进行数据整合,报告异常数据,保证数据的一致性和准确性,并保留历史数据。

3.数据的共享

对统一数据库内的部分或全部资源进行共享和交换,可生成数据使用情况报告。

4.数据的挖掘分析

通过数据挖掘工具对共享数据和历史数据进行分析评估,用报表、视图等可视化工具进行展现,为决策提供参考。

目前,我校统一数据平台可以实现数据导入、共享数据查询与维护、灵活报表管理、统一代码管理、通用组合查询显示、设置数据查询和维护权限以及数据同步等功能,但平台功能仅局限于数据的查询展示,尚不能实现校园内各业务部门的信息交换交换功能。我们希望对各业务部门的资源、平台进行更充分的整合,使得应用系统之间虽不具有直接关联,但数据交换可以在业务数据库与数据共享交换平台上完成,建成一个各应用系统耦合度较低、安全性能较强、可以完成数据集中存储与管理的数据共享与交换平台。

三、实际需求

目前,建设以全局数据为基础的数据共享交换平台已成为各高校信息化建设的核心内容。通过其建设可以有效消除信息孤岛,节约人力、物力、财力成本,提高工作效率。各职能部处可以通过该平台获取其他业务部门的数据信息,通过对数据的交换、共享、分析、挖掘,为广大师生提供更加完善的服务,为学校建设以及科学管理提供重要的依据。

另外,数据共享交换平台的建设是高校信息化建设下一阶段——智慧校园建设的工作基础。完成对学校内大数据有机的整合和继承管理,掌握学校各项活动中发生的庞大、海量数据,并利用大数据处理技术对这些信息资源进行挖掘、整理、分析,为学校的发展提供决策支持,是下一步我校信息化发展的重点工作。

经过多年的建设与发展,我校网络的基础设施建设已经基本完成,已经初步建成了支撑学校日常运行的校级统一信息系统,在业务工作中发挥了积极的作用。但现有的这些系统基本上都是各自封闭的,随着信息技术的发展以及教育改革的不断深入,当前信息系统的现状已经远不能满足学校发展的要求,数据整合工作仍然面临着诸多难题和挑战。

1.数据资产意识薄弱

数据作为重要的无形资产,其利用水平的高低可以直接反应一个高校的教学科研水平和管理能力。目前我校对数据建设的意识相对薄弱,没有充分认识到数据也会在学校的教学科研管理中发挥重要作用,导致学校内部业务系统林立,数据没有形成统一的管理制度,数据资产不能发挥有效价值。

2.数据管理缺乏规范性

目前我校内部已形成了多个业务系统,各部门依据各自的业务需求,分别采用了不同的架构及其开发技术,设计了信息系统建设标准和数据标准。但这些系统在应用及数据层面上彼此分离,导致各单位数据标准不一致,在数据共享平台的建设过程中,不能有效分析数据库表结构,在共享过程中时常出现匹配错误等现象。

3.存在信息孤岛

由于各业务系统的数据维护及管理工作缺乏统一部署,导致我校各业务系统间缺少统一的数据格式和交换接口,虽然部分数据可以通过直接传输等形式实现数据资源的交换和共享,但这种传统方法并不能及时有效地解决大量数据的交互问题,同时各类数据信息分别存储于不同部门或不同地域(分布性)的不同数据库(异构性)中,客观上形成了许多“信息孤岛”。

4.数据挖掘与决策支持应用较少

目前,我校的数据共享交换平台主要应用于数据的展示、查询、统计等单一层面,对数据进行深度挖掘分析的应用较少。合理整合校内数据,不仅能有效提高数据的利用率,优化管理结构,而且可以通过整合进行数据的挖掘、分析和预测,优化学校管理结构。通过数据整合可以大量减轻学校内部行政、教学、教辅等部门繁杂的事务性管理工作,帮助其更加关注于本部门的业务职能,并为部门及整个学校的发展提供决策支持。

四、有效措施

1.建设统一数据标准

我校于2010年12月由东北财经大学数字化校园基础平台建设组进行统一规划,制定并颁发了《东北财经大学信息标准》(以下简称“标准”)。标准的制订参照教育部《高等学校管理信息标准》(CELTS-33)的制订规范,并根据我校特点做了适当补充和调整。

标准根据高等学校职能划分和业务组成,将我校主要管理领域分为学校、学生、教学、研究生、教职工、科研、财务、办公管理、图书、资产与设备十个域,也就是对应图1的十个管理数据子集。

TB——通用/标准数据子集。作为其他十个业务数据子集的公共数据集,构成高校主要管理业务的完整数据标准集。

标准从结构上分为两部分,即数据标准和代码标准。数据标准包括一系列以管理对象为主体的数据项,其作用是明确管理对象所具有的属性,并使其在命名,类型,长度,取值范围等方面标准化。代码标准从属于数据标准,是对数据标准中数据项的属性或取值范围的描述。数据标准和代码标准的层次结构如图2所示。代码标准按照适用范围不同分为国家标准、教育部标准、行业标准、学校标准四个模块。

数据标准为我校数据平台的设计搭建提供了类似数据字典的参考作用,为信息交换、资源共享提供了基础性条件,有效地增加了各业务部门间的沟通效率。但信息标准在新的形势下也应有新的扩展,在建设过程中应与时俱进,不断加以补充完善。

2.建设数据共享交换平台

数据共享交换平台为校内各业务系统提供了一个集成的数据仓库,它将重要的、通用的数据集中到一个数据库内,数据可以在各部门之间进行有效的共享与利用。数据共享交换中心的建设有效解决了“信息孤岛”问题,可以为各项决策提供强有力的支持,最终为实现大数据综合分析提供一个可靠的、统一的数据支撑平台。[2]

应用系统与共享数据平台之间是松散耦合,数据共享交换平台的架构如图3所示。

在数据共享与交换平台中,利用ETL工具通过简单配置实现异构数据和公共数据库的数据同步、数据的解析和清洗、数据的转换等过程。管理员通过ETL客户端可以创建复杂的同步任务,只需要简单的拖拽就可以完成任务的配置。

通过数据共享交换平台,实现对ETL任务的统一监控与管理。

截止2015年12月31日,我校数据交换共享平台在运任务42个,涉及到十个系统,包括财务数据同步、资产数据同步、教务数据同步、一卡通同步、科研数据同步和多媒体教学信息同步。其中,财务系统同步任务共执行819次,资产设备同步任务共执行748次,教务系统教务成绩同步任务共执行714次,教务上课授课同步任务共执行714次,等等。2015年,所有数据同步任务共运行6182次,交换数据量约15个T。

3.完善数据展现

完成数据整合后,如何对积累的海量数据进行有效利用,充分挖掘其潜在价值是首要问题。按照教育信息化建设移动化、智能化、云化的趋势,从数据的使用方式、新媒体展现形式、数据可视化等多角度来完善数据表现,不断加强信息技术与广大师生教育教学、科研管理、公共服务等业务的深度融合。

(1)多层面多角度的数据使用

采用推送(订购),拉取(查询)等形式,用综合查询、大数据综合分析等形式为各级用户服务。如各级管理者使用的通用查询工具、数据管理服务、数据订购服务、数據分析服务等。

(2)多种新媒体形式的数据展现

除了传统的PC端数据展示之外,如何在现有移动信息化技术之后出现的多种新媒体形式,包括微信、微博、移动智能终端的进行数据展现,例如与微信平台、移动校园APP的结合,实现信息anyone,anywhere,anytime随时可达,是下一阶段工作的重点。

(3)数据可视化

在Hadoop上将HDFS存储的PB级的海量数据利用MapReduce处理之后,数据容量缩小为GB级,然后利用R语言等类似工具进行分析研究,最终转化为能为决策支持提供支撑的KB级数据,这依赖于Tableau等数据可视化工具。数据的收集、存贮、转换、筛选、分析、归纳,一切都为最终的展示服务,数据可视化工具能够以一种简便易用的方式将复杂的数据呈现出来,使用户更容易理解,并做出决策。

五、应用特点

1.架构合理,数据可控

以数据共享交换平台为核心,依托ETL技术实现数据的共享与交换,采用星形模型是最常用的实现模式,它使整个数字化校园形成了一个松耦合集成系统,实现数据调度任务的运行、监控、维护,整体系统灵活、安全、可控。

如图6所示,首先,星形架构采用不同业务系统与数据交换共享平台直接联接,而不必把多业务系统充分网状互联,建设成本低,投入小,复杂度较小,易于后期的管理维护。其次,整体系统松耦合,因为采取同步模式实现数据统一,独立业务系统故障不影响其他系统,单点故障不会对整体数字化校园系统造成冲击。最后,当某一业务系统升级或者替换,其基础数据格式、内容将发生变化,只需通过ETL调整其与数据共享交换平台的接口,并不影响与其相关的其他业务系统的正常操作,实现成本低、效率高。

2.操作简单,体验良好

目前,高校的传统业务系统并不兼容,彼此之间难以实现数据共享交流。我校使用的开源的ETL工具Kettle具有基于Java的图形化界面,支持拖拽等方式的可视化设计,能方便使用者便捷地对从业务系统抽取到的数据进行传输、清洗和加载等。同时,ETL屏蔽了应用系统中较为复杂的业务逻辑,为基于数据仓库的分析和应用提供了统一的数据接口。利用数据共享与交换平台,ETL在不同的业务系统之间搭建了一座桥梁,实现数据、业务的互联互通。

3.良好的弹性与可扩充性

数据共享交换平台的核心为ETL技术,具有良好的可扩充性。首先,ETL提供了一些可扩展组件以支持某些ETL定制逻辑的实现,同时支持自定义的SQL查询、JavaScript和正则表达式等,可自行定制开发相关组件满足学校业务逻辑的需要。另外,ETL技术支持典型的结构化数据库系统以及非结构化数据,作为应用广泛的开源工具,典型的分布式大数据架构、数据立方体等数据源也都可以处理,整体架构具备良好的可扩充性。

六、下一步计划

随着人工智能与数据库相关技术的发展,在做好数据清洗与整合的基础上,有效地应用数据挖掘手段进一步处理数据、分析数据,近年来,高校大数据挖掘与分析也成为技术研究的热点。在完成数据整合的基础上,不仅能完成传统的数据库的数据查询、统计、录入等功能,利用数据挖掘技术还可以发现数据中的隐含规则和潜在联系,而且可以通过多种有效手段对数据进行分析、对未来的发展进行预判以及对可能出现的问题进行防范。

1.数据挖掘基本概述

数据挖掘(Data Mining)一般是指在数据库或数据仓库中,利用各种分析方法与技术,对过去累积的大量繁杂数据进行分析、归纳与整合等工作,提取出有用的信息,例如趋势、模式及相关性等,并将其中有价值的信息作为决策参考提供给决策者。通俗地说,数据挖掘就是从数据中发掘信息或知识。[3]

目前,数据挖掘技术已被广泛应用于医疗、商业、科研、金融、工程管理等领域。在高校中引入数据挖掘技术,可以加快推进学校管理方式的转变,即以科学管理方式取代传统管理方式,提高高校管理质量和教学水平,提升人才培养效果,有效增强学校竞争力。

2.数据挖掘的方法

(1)关联分析

关联规则的挖掘主要有两个步骤:首先是要从数据集合中找到频繁项集,然后通过找到的频繁项集产生关联规则。

关联规则挖掘的第一阶段,必须从数据集合中,根据某一项目出现的频率来找到隐含的频繁项集,其中某项目组出现的频率称为支持度,只要某项集的支持度超过初始设定的最小支持度时,就算找到了频繁项集,然后再继续寻找下一个集合。

关联规则挖掘的第二阶段,是找到频繁项集中产生的关联规则。系统预先设定一个最小信度,如果某一规则得到的信度超过最小信度,就称这个规则为关联规则。

(2)决策树方法

决策树的输入是一组带有类别标记的样本,最终会生成一棵二叉树或多叉树,节点、叶子和分支是它的基本组成部分。决策树方法主要分为决策树生成和决策树剪枝这两个步骤。

决策树的顶端节点叫做根节点,一切决策的过程是从根节点开始的。然后根据系统的需要和特定算法创建子节点,最末端的节点成为叶子。在决策树的分析过程中,每个节点都会遇到问题,对于问题的不同回答就产生不同的分支,直到最后产生叶子节点。这就是决策树分类的整个过程。

(3)遗传算法

遗传算法是由生物进化的过程演变而来的一种算法,含有三个基本过程(算子):选择(繁殖),在旧的种群中选出具有较强生命力的个体,产生新的种群;重组(交叉),选择两个不同个体,转换它們之间的部分基因,产生新的个体;突变(变异),通过对个体进行某些基因的基因突变(1变成0,0变成1)产生新的个体。

3.数据挖掘的目标

数据挖掘的目标是从数据库中发现隐含的,有意义的知识,其主要功能有概念(类)描述、预测趋势、关联分析、聚类、偏差检测、演化分析等。下面以概念(类)描述、预测趋势、关联分析这三个主要功能,结合高校实际情况进行分析:

(1)概念(类)描述

是指通过数据区分、数据特征化比较可以得到对数据的概念或类的描述,简单来说就是对某类对象的内涵进行描述,并概括这类对象的有关特征。

例如:通过对学生基本信息数据进行数据挖掘后,我们可以将接受助学贷款、参加勤工助学、有欠缴费记录等信息的学生划分为经济困难的学生这一类别,并授权就业指导中心、各学院院办等部门在数据共享交换平台查看学生名单,以帮助辅导员更有针对性地了解个别学生生活情况,积极帮助这类学生参加勤工助学、社会实习工作等。

(2)预测趋势

是指通过建立区分概念或数据类别的函数、模型,对未知的对象进行类别预测并加以标记。数据挖掘可以自动在数据库中寻找预测性信息,以往需要通过大量手工分析解决的问题如今可以迅速通过数据得出结论。

例如:对历年学生选课时间、选课人数等数据进行数据挖掘后,系统可以自动监测到学生选课高峰期、某热门课程等,可以为学校合理规划选课时间,合理安排教室等做出预测、规划。

(3)关联分析

大量的数据中存在的某些可被发现的有用知识就是数据关联。很多数据库中都存在着数据关联,但并不为人所知,因此关联就是希望找到隐藏在数据库中的规律和有用的知识。

例如:将每位学生视为一个数据对象,将其学习成绩、在校表现、奖惩情况等属性视为该数据对象的不同数据维度,进行多维数据关联后,可以构建学生考核、测评标准,建立评价指标体系,对学生进行科学测评,减少传统测评中的人为干扰,使对学生的评价更为客观、全面和科学,同时也更加便利。

我校的数据共享交换平台存储了非常丰富的教学、科研、管理等各方面的信息,范围宽广,数据复杂,一方面为我们提供了大量可供研究的数据,另一方面在目标的选择、数据的取舍、算法的性能等方面又向我们提出了很大的挑战。

随着数据挖掘技术的不断进步,我们希望未来可以透过数据表面,分析得到其内在本质,获得更有价值的信息,用更加科学系统的方法对学校的信息资源加以利用,优化资源配置、提高教学质量、提高学校综合实力。

参考文献:

[1]戚丽,蒋东兴,武海平.校园数据中心建设与管理方法的探索[J].中国教育信息化(高教职教),2002(7):54-55.

[2]丁智君.高校数字化校园的数据中心平台建设[D].上海:复旦大学,2009.

[3]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].北京:机械工业出版社,2007.3:88-100.

篇5:交换与共享:电子政务的基石

――北京市经济社会基本单元基础信息交换工程

自 起,全国一些主要城市已开始进行企业基础信息交换工作。这些交换工作主要发生在工商局、地税局、质监局等单位之间,并已在税收征管系统、企业信用信息系统应用中发挥了重要作用。

但是,这项庞大的基础信息交换目前却面临着三个主要问题:一、没有统一的交换制度和机制;二、没有统一的数据交换标准(交换标准包括业务数据标准与技术标准两个方面),数据交换后,难以对数据进行比对和整理,难以取得数据交换的应有效果;三、没有统一的交换系统。目前的交换方式比较繁杂,既有通过计算机网络完成的交换,也有通过软盘或纸质文档进行的交换,因此数据的准确性和安全性方面存在很多隐患。由于上述三个问题,各政府部门在处理诸如企业、事业、社团单位的登记、注册、变更、年检、注销等业务时,无法及时交换信息,不但造成了政府各部门大量重复性录入工作,而且很难保证基础信息在各部门的一致性。另外,随着我国电子政务各项工作的深入推进,以及网上企业年检、银税共享工程等一批信息化应用工程的建设,许多政府部门需要共享机关、企业、事业和社团等多种经济社会基础信息。实现经济社会基本单元基础信息交换与共享势在必行。

北京市“经济社会基本单元基础信息交换与共享”建设的目的是通过将工商、税务、质量技术监督部门、市编办、民政局社团办各自业务系统连接起来,建立部门之间、企事业单位之间的基础信息交换和共享的分布式信息交换系统,促进包括一站式联合网上审批、网上企业年检、企业信用等重大应用项目在内的政务工程建设、提升政府信息化应用水平、优化环境、促进经济社会发展。

基础信息交换与共享系统

经济社会基本单元基础信息交换(以下简称:信息交换系统),是利用易达讯网络科技有限公司提供的全面应用集成(EAI)产品,实现工商行政管理部门、税务部门、质量技术监督部门、市编办及民政局社团办之间企事业单位基础信息资源交换和共享的业务管理系统。该系统以现有业务应用系统为基础,通过基于XML、Web服务的消息交换系统(Messaging Systems)和流程管理系统(BMPS)制定切实可行的动态政务信息交换业务,逐步理顺工商与税务互联涉及的业务流程,形成信息化条件下跨部门的系统工作机制。信息交换系统成功连通了包括国税、地税、工商、技术监督、市编办、民政局社团办在内的各政府部门,利用动态信息交换和共享技术实现了任何一个企事业单位的信息在相关政府职能部门的同步,并通过灵活的业务流程管理平台实现企业信息以流程自动化的`方式在各政府部门数据库之间共享及更新,并将其应用范围进一步扩大到更多的部门及应用。

交换系统是一个跨平台的分布式系统,涉及到多个相关委办局。

各相关委办局既是数据的提供者,又是数据的使用者,一方面将本部门的数据其他委办局使用,另一方面接受来自其他部门的数据。在委办局建立独立于现有业务系统的交换前置机,实现经济社会基本单元基础信息的上传和接收。

在市工商局等部门的前置机,安装应用集成服务器软件、应用适配器,并进行相应的配置,完成和外部的数据交换。上图中,市国税局、市质监局、市编办、市社团办的交换系统的逻辑结构和市工商局、市国税局的结构类似。

其中,市信息办交换节点不参与具体的数据交换流程,但对整个交换系统提供支持和管理服务功能。

在市工商局等其他6个节点,通过交换平台实现各个交换节点共享数据库之间的数据交换和共享。在各个节点部署的接口子系统实现共享数据库和委办局业务系统数据库之间的数据交换和转换。

在各个交换节点,交换前置机部署在北京市政务内网部分,委办局的业务系统和业务数据库部署在委办局的局域网中,两个网络之间的连接为安全隔离。安全隔离是指各个委办局根据自己对安全的实际需求,采用具体的连接方式,或者是逻辑隔离,或者是物理隔离,或者两者断开。根据实际的连接情况,接口子系统和业务系统之间通过网络或者是存储介质利用数据的导入导出的手段实现数据交换和转换。

在市信息办交换前置机上,安装交换平台的基础软件和交换平台管理系统,实现对交换平台的管理和服务。

信息交换系统的功能

信息交换

建立经济社会基础数据库,实现数据交换的存取、连接和权限控制等功能。通过公共数据交换平台,实现企事业基本数据的公共交换,以充分保证对整个交换信息平台的有效管理、交换信息备份及历史信息记录。

交换系统的交换内容可以按数据来源分为工商、地税、国税、质监、编办、社团办六类。

数据比对

在部门间数据交换的基础上,根据各部门业务的需要,对来自不同部门的基础信息进行自动比对和人工比对,根据比对结果,找出部门间数据差异和问题,并更好的服务于本部门的业务工作。例如,税务部门将从工商部门交换来的企业开业注册登记信息和税务登记信息比较,找出已办理工商开业登记但未办理税务登记的企业,再剔除不需要办理税务登记的企业,对剩下的企业就可以进行重点监控和检查,达到加强税源监控的目的。

由于目前各委办局的业务系统中基础信息存在着不少数据质量问题,主要体现在以下几个方面:

1、企业代码不一致:每个委办局的业务系统采用了不同的编码来表示一个企业,如工商局业务系统中的企业注册登记号,税务系统中的纳税人识别号,质监系统中的企业组织机构代码等,这些系统以各自的编码规则组织、管理企业信息,编号仅在本系统中有明确的含义,到了别的系统中则可能没有意义。

2、数据量不一致:由于目前各个业务系统之间尚未实现实时的数据交换,存在着企业注册后,没有办理组织机构代码、税务登记等业务,造成了各系统之间数据的差别。

3、数据项数据不合法:比如企业名称、注册日期等。

4、数据项数据不一致:各个业务部门记录的同一数据项的内容不同,主要体现在企业名称、注册登记号、注册地等数据项。

5、代码标准不一致:比如民族、性别等,在不同的系统中采用不同的代码。

经济社会基本单元基础信息来自各委办局的

业务系统,由于各业务系统的数据存在上述问题,因此,要对采集到的原始数据进行加工整理、比对和整合,对各个业务系统的数据质量进行改善。

针对历史数据和新增数据,可采取“自动比对和手动比对”等不同的方法进行。这里的历史数据是指在使用数据交换系统以前积累的数据,新增数据是指各单位使用数据交换系统以后产生的业务数据。

业务系统接口

为了保护各委办局业务系统的安全性和独立性,在各委办局建立企业基础信息共享数据库,用于存储各单位向外发布的信息和从其他单位交换过来的信息。

篇6:数据交换与共享平台建设

第一,基础信息的采集。我们的大量信息还是要依赖手工录入,因此存在效率低、差错率高、更新不及时等问题,影响后期的整个传输和应用,而这是信息化的基础。如何解决物流信息的采集问题是起点,接下来是信息的共享和交换。

第二,在“十一五”期间我们可能采取的一个方案是将RFID用在物流装备上,而我们的商品可能还是以条形码为主。这样的方案作为我们物流信息化的基础框架,通过进行动态跟踪识别,间接掌握商品的信息,而不是一下子将RFID技术用到每一件商品上,

第三,平台式信息交换共享的体系。建立公共平台已经成为共识,大家都在呼吁信息整合。但是,大家有时把公共信息平台理解成为一个有形的机构,一个集中信息储存管理的机构,或者是集中管理的数据库。我觉得这样的理解是非常狭隘和不全面的。我理解它是一个体系,有很多层次的工作要做,建立一些必要的集中管理的数据库可能是需要的,但是更多的还是信息交换、信息共享的一种机制,一种模式。所以,平台实际上是要创造一个信息交换、信息共享的方式和环境。

篇7:数据交换与共享平台建设

关键词:数字化校园,数据交换与共享

0 引言

统一数据交换与共享平台是数字化校园的数据引擎,在这个引擎的工作下,各个业务系统才能构成一个有机的整体,数字化校园体系才能发挥其最大的功效。

数字化校园体系由公共平台和业务系统两部分构成,其中公共平台由数据标准以及数据交换与共享平台、统一身份认证平台和信息门户平台组成,业务系统视各高校的具体情况而定,某医科大学的业务系统由教务管理系统、研究生管理系统、人事管理系统、一卡通等组成。数据交换与共享平台是数字化校园体系架构的核心元素,实现数据在各个应用系统之间的交换,保证数据的权威性和唯一性和实时性。

1 构建数据交换与共享平台

数据交换与共享平台的建设目标是建立全校统一规划的数据中心,在统一的标准下整合数据,实现全校数据统一存放、统一管理、联合共享的目标。构建数据交换与共享平台不仅仅是搭建系统,更重要的是建立标准,制定合适的数据交换方案。其建立需要统一数据标准、数据资源使用调查、构建公共数据库、实现数据交换五个步骤。

1.1 统一数据标准

首先确定参考标准,这里的参考指的是学校在今后的信息化建设中准备遵循的标准,在高等教育领域这类的权威标准不多,因此也不难选择,我校以高等教育信息化信息集为参考标准。第二步需要建立现行标准,现行标准的建立必须通过与业务部门的充分沟通,以学校基本代码(机构、人员)的标准化为出发点,逐步扩展到更多的领域。

1.2 数据资源使用调查

在建立数据标准的基础之上,为了确认权威信息来源,建立公共数据库,还需要进行数据资源的使用调查。在调查过程中我们可以采用UC矩阵这种常用的信息系统分析方法。通过对各部门(系统)分发具体信息条目的uc表格,可以获得初步的UC矩阵。经过对这个UC矩阵的完备性和一致性检查,不仅可以获得公共数据库所必需的共享信息,还可以发现数据交换的走向和任务,所以数据资源使用调查是统一数据平台建设的一个重要步骤。

UC调研矩阵,是今后数据交换的依据。应该明确学校中主要应用间的数据流向,进行简化和整理之后,确定权威数据来源,确定数据使用者和数据使用周期。

1.3 构建公共数据库

将全校公用的数据统一存放,给使用者开放数据接口,保证了数据的唯一性和权威性,避免出现数据孤岛;同时将各部门相同的业务数据分类存放公共数据库,便于领导在整体上掌握某类业务的情况。

1.4 安装元数据管理系统

部署安装元数据管理系统,由下面六个步骤:(1)操作系统:红旗Linux 5.0;(2)JDK:j2sdk1.4.2.12;(3)JBoss:JBoss323;(4)Java代码编译工具:JBuilder 9;(5)Sub Version 1.4.3;(6)SVNWeb Client。

1.5 实现数据交换

实现数据交换从技术上讲要熟练掌握数据交换工具,设计数据交换的过程。然而数据交换实施中更多的是规划、协调和确定方案。

数据交换往往涉及到学校的多个业务部门,因此它的实施过程也是一个需要学校各个部门与开发人员通力配合,大力推进的过程。数据交换需要以下几个步骤:

(1)协调数据提供者。确定具体的数据字段和业务数据与标准化的公共数据的映射关系。

(2)制订数据交换方案。实施人员根据讨论的结果制订具体的数据交换方案,形成文档。

(3)进行数据交换过程的设计。实施人员根据数据交换方案使用数据交换引擎和相关技术进行交换过程的设计,确保设计完全满足和符合数据交换方案。

(4)数据交换过程的测试。设计好的数据交换过程,需要经过在测试环境下进行严格的测试,保证交换结果的正确性和交换过程的可靠性。

(5)正式运行数据交换。经过测试的数据交换过程,在正式运行前需要由项目负责人在数据交换方案上签字确认。

(6)协调数据使用者。经过数据交换以后,权威的数据已经集中到公共数据库中,并且是基于主题模式(如以用户为主题)的不再是按照零散的业务系统的划分。此时需要与数据的使用者(通常是与数据提供者不同的多个学校单位)进行协商确定数据服务提供的方式。

(7)制订数据服务方案。实施人员根据协商的结果制订具体的数据服务方案,形成文档,送交校方数据交换负责人和相关业务部门数据交换负责人进行审核。根据反馈意见,修改交换方案。

(8)提供数据服务。实施人员根据数据服务方案使用数据交换引擎和相关的技术对外提供数据服务。由于数据的使用者不能够修改数据,所以这种对外服务通常都是查询服务。

2 结束语

经过这样一系列的过程,数字化校园统一数据交换与共享平台就完成了。数字化校园的数据引擎就可以正常的运转了。

参考文献

[1]西安长城数字公司项目文件文件.

[2]赵安新,吴晓霞,穆荣.数字化校园建设初探[J].技术与创新管理,2008,(5):3-5.

[3]郭静.对高校“数字化校园”数据中心建设的研究和实践[J].中国教育信息化,2007,(23):19-20.

上一篇:小白兔小学优秀作文400字下一篇:青龙街小学四年级