数据仓库在网络实验平台中的应用

2022-09-11

一、引言

我国高校的数字化建设已经进入了全新的阶段,教学资源在网络平台上实现了面向师生、面向校园内外的最大共享。虽然数字化程度越来越高,数据的共享程度越来越大,但是高校的教学信息大部分仍是在数据库系统中,并没有真正发挥其在教学中的巨大作用。高校的网络实验教学平台是现阶段高校实验教学的重要组成部分,但是开设的实验教学数据只能向师生提供简单的查询服务,师生并不能根据自己的需求对平台数据进行系统化分门别类的查询和深入分析,不利于对实验平台的有效利用。而数据仓库技术通过对实验数据库中数据的分析和整合,挖掘隐藏在这些数据后面有价值的信息,为使用者特别是相关实验管理人员对实验数据的决策分析及宏观利用上提供了科学依据。既能有效提升高校实验教学的信息化管理水平,也能为师生更有效的利用网络实验平台数据、增强实验教学效果提供良好保证[1]。

二、数据仓库技术

数据仓库(Data Warehouse,简称DW)的概念是由William H.Inmon在1991年出版的“Building the Data Warehouse”一书中提出来的[2]。

传统的数据库管理,数据库之间是相对独立的,用户的数据操作一般只局限于单个数据库的数据操作,涉及到多个数据库的相关信息数据的操作时,也会受到数据结构和类型的限制。而数据仓库则是通过抽取、清理、装载和刷新某个或某些数据库的数据,并在此基础上通过系统化再加工、重新整理和汇总得到的,因此在数据仓库中的数据结果虽来源于历史数据库却又消除了源数据的不一致性,是对源数据的加工集成[3]。

数据库是根据实体之间的逻辑结构建立的数据模式,数据之间有一定直接或间接的逻辑关系,用户在对数据库数据组织操作主要是面向基本、日常的事务处理,例如银行交易。数据仓库的数据处理是面向主题的,例如按照不同层次用户的特定要求在某一主题领域进行数据组织,因此数据仓库支持更复杂的数据分析操作,为不同的用户提供决策支持的数据查询。

用户对数据库进行操作的数据都是某时间段的更新数据。数据仓库的数据则是对某时段源数据的分析加工得来的,反映的是数据的历史变化,而非即时数据的查询,也几乎不会对源数据进行有修改和删除操作,只要定期的加载和刷新,数据的相对稳定性强[4]。

由此可见,数据仓库不同于传统概念的数据库,正如William在书中指出的,数据仓库是一个基于历史数据集成的、面向具体主题的、相对稳定的数据集合。

三、网络实验平台的数据模式

网络实验平台需要模拟现实实验,将现实中的实体直接映射到计算机的虚拟空间,使用户能使用相关软件系统在网络实验平台上完成实验教学的目标,解决现实中的教学问题。网络实验平台涉及到教师、学生、实验项目、设备等多方面的数据操作和管理问题。一般来说,网络实验平台的数据建模设置如下各类属性和操作[5]。

(1)教师:用户登陆信息、整合实验项目、管理学生、管理实验及相关数据、挖掘新实验和知识点、回复学生问题。(2)学生:用户登录信息、实验模块的选择、实验过程、实验结果、实验报告、提出相关问题。(3)实验:实验项目、实验类型、实验目的、实验内容、实验参数、实验报告、实验交互实现。(4)管理:仪器的技术参数、功能指南、使用说明、操作规范,实验环境,实验项目的在线管理。

以上是网络实验平台的关系数据模式,数据量大而细致,使用者类型繁多包括管理员、教师和学生,学生有包含多个专业和层次,因此不仅需要软件技术去实现数据的按需分析,还要对网络实验进行管理的决策支持。引入数据仓库技术来抽象、分析和挖掘网络实验数据,使其能更高效而合理的满足网络实验平台众多用户不同层面的实验教学需求。

四、网络实验平台的数据仓库构建

网络实验平台的数据仓库构成包含四个层次,具体如图1所示。

(一)数据来源

数据仓库的数据通常包括内部和外部信息两方面,内部信息主要是校内网络实验平台中实验项目的相关数据信息,例如用户登录数据、实验操作数据、实验设备数据及各类文档数据。外部信息包括专业需求信息、课程整合信息、媒体应用信息等。

(二)数据仓库构建

数据源进行相关抽取、清理、再组织,形成了新的数据组织系统,即数据仓库。数据仓库形成的产品和技术取决于数据仓库的特点,例如网络实验平台数据仓库的构建,可以对相关实验数据信息进行抽取、清理,再按照专业主题或能力层次主题进行重组,并有效集成。按照实验数据信息覆盖的范围,可以将数据仓库分类,例如专业级数据仓库、课程级数据仓库、项目级数据仓库等等。建立数据更小、更集中的数据仓库(数据集市),能为数据分析提供更有效的捷径,为实验教师利用已有的数据获得重要教学提示或找到丰富教学内容的新实验方案。

(三)OLAP服务

联机分析处理(OLAP,online analytical procession)服务允许以多维结构访问来自网络实验平台数据仓库的经过聚集和组织整理的数据,以便从多角度、多层次展开分析学习需要,并发现实验教学趋势。OLAP具有快速呈现数据分析结论的优点,通常有电子表格模型和数据库模型两种基本工具模式。

(四)前端集成

这个层次主要是利用各种基于数据仓库或数据集市的应用开发软件实现,包括为用户提供决策的数据分析、数据挖掘等的工具软件。其中数据分析工具主要针对OLAP,数据挖掘工具主要针对数据仓库。

按照四个基本模块设计网络实验平台数据仓库,首先,对整个实验教学系统、与实验教学相关的各类数据进行抽取,并通过各种手段进行加工,如清理、装载、刷新等,“组建”由数据集市构成的数据仓库,有利于对数据系统化、一致化的集成。其次,从实验教学管理角度出发,根据不同的实验对象分析其数据组织原则,使用数据仓库技术,针对不同类型的实验项目、不同层次的实验教学对象,建立出相应的星形数据模型。最后,根据实验平台各个层次使用者的决策需要,建立出各种联机分析的多维模型,充分利用所有实验数据,使其更好地形成全面的实验教学信息分析应用。

五、总结

数据仓库技术对于高校网络实验平台的数据管理有着重要的作用,经过组织再构的数据能为实验平台的各类用户提供实验决策支持,能有效提高网络实验教学平台的利用率,使其真正服务于高校的实验教学工作,也为实验管理者与教师提供了重要的决策参考,对实验教学水平的提升和管理决策的实时调整有积极的意义。

摘要:网络实验平台是高校实验教学重要的组成部分,针对网络实验设置和使用者需求不匹配等问题,引入数据仓库理论及其技术。通过对实验平台数据进行抽象、分析技术,为网络实验的各层次使用者提供数据决策支持,以提升网络实验平台的利用率,促进高效实验教学的发展。

关键词:数据,数据仓库,网络实验

参考文献

[1] William H.Inmon.数据仓库[M].北京:机械工业出版社,2006.1.

[2] 马宏斌,陈红,丁群等.虚拟实验室数据仓库管理[J].实验室研究与探索,2006,25(11):1390-1391.

[3] 孙林檀.探析数据仓库技术在电力客户服务领域的应用[J].机电产品开发与创新,2017,30(5):74-75.

[4] 姚奕,苏广和,冯林平.工程专业网络虚拟实验室的建设与探索[J].实验室研究与探索,2013,32(5):212-214.

[5] 刘颖,刘淼晶.高校虚拟实验室的数据中心建设研究[J].电脑知识与技术,2015,11(26):3-5.

上一篇:新形势下医院宣传工作的策略下一篇:英语语言中的性别差异