区域公共大数据资源平台建设研究——以苏州A教育园为例

2022-09-10

一、建设背景、目标与思路

(一) 建设背景

苏州A教育园是苏州工业园区转型发展的核心项目, 区域总规划面积约25平方公里, 规划总人口40万人 (其中学生规模约10万人) , 致力于构建高水平的产学研合作体系, 重点发展纳米技术、生物医药、融合通信、软件、动漫游戏及人工智能产业, 未来建设成为高新产业聚集、高等教育发达、人才优势突出、环境功能和创新体系一流的科教协同创新示范区。在数据和信息价值逐渐凸显的今天, 建立统一、高效的区域公共数据资源体系, 对数据资源进行整合管理, 为用户提供统一用户管理接入, 应用所需大量数据进行支撑, 已成为了趋势。在城市化进程不断加快的今天, 数据海量化、网络互联化、动态实时化、覆盖全面化的特点, 使有效利用城市信息化资源成为城市和区域管理的重要组成部分。城市信息化不仅是信息技术基础设施的建设完善过程和信息产业的发展过程, 更是充分利用数据资源改造和发展社会、经济、文化、管理等领域的过程。通过对数据资源的利用, 一方面可以为苏州A教育园信息化管理手段提供支撑, 更可以为集约、协同、智慧化的管理提供数据支持;另一方面, 通过对数据的综合分析和挖掘利用为区域管理的科学规划、精细管理和创新发展奠定基础。

(二) 建设目标

基于区内良好的数据资源基础设施环境打造完备而具先进性的数据资源体系, 构建完整而具有弹性的数据资源获取和开放架构, 支撑丰富而贴近需求的智慧应用建设, 搭建各方共同参与的智慧平台和治理结构, 探索政府主导市场运作的商业模式, 实现区内“科教智慧化、生活服务智慧化、政府服务智慧化”的总体目标, 公共大数据资源平台的构建将成为区内发展信息化的重要的基础性工作。

构建完整的苏州A教育园公共数据资源体系, 为科教协同、政务应用、便民服务、商业服务等提供数据资源支撑, 具体包括:构建包括数据采集 (交换) 、加工挖掘、应用、共享、管理等在内的完整的数据资源体系。通过分布式计算框架, 提升数据资源处理速度;通过网络接入资源体系和应用资源体系, 实现区内各类用户数据和业务数据的统一采集和管理;有效利用园区“三库”数据以及其他政务和商业数据, 实现与苏州A教育园现有数据资源的融合;基于数据挖掘分析, 发掘数据价值, 辅助政府基于事实做管理和基于分析做决策。

(三) 建设思路

苏州A教育园公共大数据资源平台采用集约化的建设思路, 是在最充分利用教育园内较完备的网络资源基础上集中合理地运用现代管理与技术, 充分发挥区域内高精尖人才资源的积极效应, 以提高平台效益和效率;同时对于数据的处理上, 综合考虑教育园区内的具体情况, 对学生、教职工、企业员工信息主数据进行标准化管理, 对学习科研产生的分散数据进行统一管理、统一梳理, 对冗余的数据进行适当丢弃。完整的公共大数据资源平台为苏州A教育园科教协同、政务应用、便民服务、商业服务等提供数据资源支撑。

二、主要建设阶段及内容

苏州A教育园公共大数据资源平台一方面为各类应用提供基础公共数据支撑, 同时有效支撑协作类、创新类应用的建设, 另一方面从数据资源利用的本身, 通过有效的建模和挖掘形成对规划、决策、预测在内的各类深度应用的数据支撑。此外通过数据体系的开放和运营, 形成数据资源和应用相互促进的良性资源增长增值体系, 公共大数据资源平台按数据整合阶段、数据内部挖掘阶段和数据循环服务阶段等三个阶段进行建设, 结合数据资源数量的不断增加应用、不断扩展和完善的。

(一) 数据整合阶段

苏州A教育园公共大数据资源平台建设, 首先采集和整合已有的学生生活数据、科教数据、园区已有人口、法人基础数据等, 形成基本数据资源。通过梳理和数据建模, 构建数据资源之间的关联关系, 形成对公共基础数据资源的管理体系。对初期接入的数据资源进行服务化封装, 以数据服务的方式支撑各类应用对公共基础数据资源查询、统计等基本需求, 包括:

1. 区域用户统一认证

通过对区域内学生、教师、企业、居民等各类主体数据的采集, 结合园区人口基础库数据的对接, 形成区域内人口基础数据。对于苏州A教育园公共大数据资源平台应用服务资源体系、网络接入资源体系等应用层资源体系的统一登录接入, 提供用户认证的基础数据支持。区域内的用户和认证体系, 尤其是实名认证体系, 未来也可以和园区整体的实名认证体系进行整合和融入。

2. 基础类数据查询接口

结合采集的各类主体数据 (包括:学生、教师、企业、科研机构、居民等) 和主题数据 (包括:科研成果数据、宿舍安排数据、用电/水数据等) , 封装成基本的查询、统计和比对服务, 通过数据服务平台统一对外提供, 供苏州A教育园公共大数据资源平台应用系统在权限范围内调用。解决应用系统对基础数据调用的需求, 避免重复建设, 也有效的解决各应用系统 (如注册环节) 主体数据的重复录入等问题。

3. 协同类应用数据支持

苏州A教育园公共大数据资源平台面向科教协同、政务服务、居民服务等方面的大量协同应用, 这类应用建设对跨领域数据资源需求强烈。通过统一的公共大数据资源平台进行数据资源采集和关联管理, 可以有效的根据应用对数据资源, 尤其是跨系统、跨业务、跨领域数据资源的需求, 整合和组装对应的主题数据资源, 有效的支撑协同类应用的建设。

(二) 数据内部挖掘阶段

随着苏州A教育园公共大数据资源平台相关应用系统的建设和使用, 包括网络接入数据、科教协同数据、区域政务服务数据、区域居民服务数据等数据资源会逐渐补充到公共大数据资源平台中来。随着数据资源规模的提升和覆盖面的扩展, 为数据资源的深度利用提供了基础。此阶段在持续完善基础类数据查询和主题数据建设之外, 重点扩展挖掘类应用和数据产品开发两方面应用。

1. 数据挖掘类应用

在汇集的各类数据基础上, 以主体数据为轴, 构建包括状态数据、活动数据、服务数据等全景数据关联。结合数据加工团队的构建及相关成熟挖掘工具的引入, 采用分类、聚类、回归、预测、关联分析等数据挖掘技术, 开展数据资源分析与数据挖掘模型建模工作, 挖掘数据资源本身的关联和潜在价值, 进一步扩展数据服务提供反馈, 深化数据服务的价值, 开展的挖掘主题包括:学生后勤服务 (用水/用电等) 分析与预测:针对学生平时生活习惯 (用水、用电量, 使用高峰期) 等基本数据, 进行数据挖掘, 提前调配资源, 避免资源供给不及时的问题;教学资源需求预测:对教学资源 (教室、实验室、教学器械) 使用情况的数据进行挖掘, 合理安排教学资源使用, 避免资源闲置或是使用冲突;商业设施需求分析与预测:挖掘居民、学生、教职工人员平时消费习惯, 根据需求趋势提供更好的商业服务, 获取更大的商业利润;企业人才需求分析与预测:挖掘区域人才流动情况, 为人才推送合适岗位招聘数据, 为企业输送合适人才, 提升区内生产力发展;公共服务设施需求分析与预测。挖掘居民、学生、教职工人员平时公共设施使用情况及需求, 在最需要的地方加强公共服务设施建设, 提升居民生活幸福感;科研成果对接分类分析:对各个科研成果涉及领域进行分类, 对科研成果效用进行分析, 使科研成果能用在最恰当的地方。

2. 数据产品开发

开发相关数据产品, 包括:数据集、数据分析报告、可视化报表等的开发, 为政务部门、组织机构 (学校/企业/科研院所等) 、个人提供产品化数据服务。

(三) 数据循环服务阶段

经过整合和挖掘阶段, 构建起相对完整的数据资源管理体系, 同时形成包括组织、人员、工具在内的相对成熟的数据挖掘分析体系。在此基础上, 逐步形成可以根据外部服务需求, 智能化构建数据渠道和模型支撑的能力和管理机制。

1. 商业数据互动

在法律法规和相关政策的框架下, 和区域外商业应用进行数据资源的互动, 构建数据循环增长体系。通过区域内有效数据资源的提供, 置换商业领域和全局性数据资源, 在科研成果转化、校企对接、便民服务等主题上, 进一步完善和提升数据资源的规模和质量, 支撑上层应用资源体系的完善。

2. 开放数据生态圈构建

构建以数据资源开放为核心的开发门户, 通过对区域可提供的基础数据资源的封装 (如按照可公开的权限提供的公共设施数据、交通路况数据、学生/居民服务数据等) , 开放给企业、个人等第三方应用开发和商业运营单位, 帮助其开发各类区域便民服务应用。一方面, 丰富区域内服务应用体系。另一方面, 通过个性化、增值化的应用的建设和推送, 带动区域创业创新热情, 促进相关产业的发展。

三、未来效益分析

(一) 经济效益

(1) 在数据资源层面进行统一, 实现苏州A教育园公共大数据资源平台各项目在基础数据资源层面的集约建设, 节省投资。

(2) 以数据资源持续运营的理念开展相关建设, 逐渐形成良性的运营机制, 在政府初步投入的基础上, 实现自我造血, 维持体系的不断发展。

(3) 以此为推动, 激活科教协同信息化产业活力, 有效促进区域IT产业和大数据产业的发展。

(4) 平台收益来源包括公共服务平台政府补贴以及自有产品开发收益两部分。

(二) 社会效益

(1) 汇聚各类实验室、教室等科技、教育资源, 方便公众查询、使用, 打通数据壁垒, 消除信息孤岛, 推动基于大数据的公共大数据资源平台数据资源体系建设。

(2) 打通高校、企业交流合作信息瓶颈, 促进难题招标、成果转化、实习实训等各类校企合作交流, 推动科教协同工作的深化和创新。

(3) 利用云计算、移动互联网、融合通信等信息化技术手段, 为区内师生、企业提供虚拟互动交流、智能客服在线咨询等多种综合服务内容, 形成高校、科研院所、企业以及各类资源的深度融合开放平台和专业化互动社区, 提升政府、高校、科研院所、企业、教师、学生之间信息沟通效率。

四、结语

在数据和信息价值逐渐凸显的今天, 建立统一、高效的数据资源体系, 对区域内外数据资源进行整合管理, 为用户提供统一用户管理接入, 已成为了趋势。苏州A教育园公共大数据资源平台可以作为示范来指导其他类似区域的信息化发展, 减少信息化建设资源投入, 进行自身数据积累、升级换代和内外结合, 同时也可以把苏州A教育园公共大数据资源平台做成一个反复迭代的、可持续发展的应用的大数据体系。

【相关链接】

在时下商界的流行语中, 很难找出一个比“大数据”更吸引眼球的术语了。大数据的颠覆和创新作用几乎在每个行业都有体现, 风电行业也不例外。

20世纪90年代末, 美国航空航天局的研究人员创造了大数据一词, 自诞生以来, 它一直是一个模糊而诱人的概念, 直到最近几年, 才跃升为一个主流词汇。但是, 人们对它的态度却仍占据了光谱的两端, 一些人对它抱有近乎宗教崇拜的热情, 认为大数据时代将释放出巨大的价值, 是通往未来的必然之途。在一些观察者眼中, 大数据已成为劳动力和资本之外的第三生产力。而怀疑者称, 大数据会威胁到知识产权, 威胁到隐私保护, 无法形成气候。

首先, 结合了大数据分析和天气建模技术的能源电力系统能够提高风电的可靠性。以往对风资源的预测不够精准, 在风能无法贡献预期功力时, 火电就要作为后备电力。这样, 电网对风电的依赖程度越高, 需要建设后备电站的成本就越高。另外, 启用火电站的就等于向环境中释放碳排。然而, 在大数据分析的帮助下, 温度、气压、湿度、降雨量、风向和风力等变量都得到充分考虑, 对风电的预测更加精准。电网调度人员页可以提前做好调度安排, 也有助于电网消纳更多风电。除了做到更精准的预测, 检测和采集风机的运转数据、风场的运营数据还有利于风机制造商更好地改善风机的性能, 风电场业主在追求风场效益最大化时也离不开大数据。

摘要:基于苏州A教育园公共大数据平台建设的实践, 本文详细介绍了平台建设背景、目标、思路、主要内容和未来收益等, 希望将挖掘的数据资源进行有效利分析用起来, 促进区内数据资源体系可持续健康发展, 并为区域性公共信息化建设提供有价值的模式和应用参考。

关键词:区域,公共大数据资源平台,建设

参考文献

[1] 张甦敏, 方红, 陈林利.区域公共卫生大数据平台建设初探[J].中国卫生信息管理杂志, 2016, 13 (3) :280-283.

[2] 赵嘉凌.针对公共文化共享服务的大数据采集和分析平台研究[J].四川图书馆学报, 2018 (1) :30-33.

[3] 蒋美玲, 王芹.大数据时代公共信用信息数据归集的原则与策略——基于苏州市的分析[J].电子政务, 2018 (6) .

上一篇:以“有效教学”优化数学课堂下一篇:三维适形放射治疗联合肝动脉化疗栓塞治疗原发性肝癌的效果分析