基于数据仓库的高校就业信息资源建设的研究

2022-09-12

1 绪论

随着普通高等教育毕业生就业体制由计划分配体制向市场双向选择就业的根本性转变, W T O的加入和“扩招”步子的不断迈进, 中国高等教育正从精英教育向大众教育转变。高校毕业生就业工作已经成为带动高校各项工作的龙头, 成为事关高校声誉和生存发展的关键。相应的管理信息系统也越来越多地应用在就业信息资源的建设中。然而, 系统的持续运行使得信息系统数据库存储的数据量急剧增大[1]。以我校为例, 目前庞大的数据集合无论在时间意义还是空间意义上, 都无法有效的理解和使用这些数据;并且, 传统的信息系统是基于查询驱动的, 数据库作为历史知识库对于一般的查询过程是有效的, 很难对数据进行深层次的处理。不能获得重要的有价值的知识, 从海量的原始数据中收集和整理宝贵的资源, 由此引出一个新的研究方向:数据仓库和基于数据仓库的相关技术的研究。

2 数据仓库与数据挖掘技术

2.1 数据仓库的定义

数据仓库概念创始人William H.Inmon在《数据仓库》一书中对数据仓库的定义是:数据仓库是一个面向主题的、集成的、非易失的、随时间变化的用来支持经营管理中决策的数据集合。从定义可以看出数据仓库有这样四个基本特征[2]:

2.1.1 数据仓库的数据是面向主题的

所谓一个主题, 在逻辑意义上, 对应企业中宏观分析领域所涉及的某一个分析对象。“主题”在数据仓库中是由一系列表 (Table) 实现的, 这些表通过公共码键联系起来, 但它们应该根据用户对主题中不同表的关心程度不同分别存储在不同的存储设备中。主题的划分必须保证每个主题的独立性, 而且需要保证对主题进行分析时所需要的数据都可以在此主题内找到。此外, 面向主题的数据组织可以独立于数据的处理逻辑。

2.1.2 数据仓库的数据是集成的

数据仓库的集成性是指根据决策分析的要求, 将分散于各处的源数据进行抽取、筛选、清理、综合等集成工作, 使数据仓库中的数据具有集成性。

高校就业信息库信息量大、构成多维、要求精确、动态变化频繁, 是一项复杂的系统工程。学生基本信息库是高校就业信息管理的依据, 包括学号、性别、姓名、专业、籍贯、生源所在地等信息;用人单位信息表有接收地代号、单位性质、单位名称、招收专业等信息。

2.1.3 数据仓库是不可更新的

数据仓库不可更新是指数据仓库的用户进行分析处理时是不进行数据更新 (修改) 操作的, 但并不是说在数据仓库的整个生命周期中数据集是不变的, 是可以添加、刷新和删除的。

2.1.4 数据仓库中的数据是随时间变化的

数据仓库最根本的特点是物理地存放数据, 但这些数据并不是最新的、专有的, 而是来源于其它数据库。数据仓库的建立并不是要取代数据库, 它要建立在一个较全面和完善的信息应用的基础上, 用于支持高层决策分析, 而事务处理数据库在企业的信息环境中承担的是日常操作性的任务。

2.2 数据挖掘

数据挖掘 (Data Mining, 简称DM) , 历史虽然很短, 但从20世纪90年代以来, 它的发展速度很快, 引起了许多专家学者的广泛关注[3], 鉴于对学科综合的产物, 人们提出了多种数据挖掘的定义。一个普遍的定义是:DM又称数据库中的知识发现 (Knowledge Discovery from Database, KDD) 。KDD首次出现是在1989年8月举行的第11届国际联合人工智能学术会议上, 它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。数据挖掘过程可描述为[6]:数据库经过清洗与集成得到数据仓库, 再经过集成与转换为待定数据集, 通过数据挖掘得到一定的数据模式来评估和表示数据。

数据挖掘是一门新兴的交叉学科, 它汇集了机器学习、模式识别、数据库、统计学、人工智能以及管理信息系统等各学科的成果。多学科的相互交融和相互促进, 使得数据挖掘这一新学科得以蓬勃发展, 且已初具规模[4]。在我国也逐渐在很多行业的到了广泛的应用和巨大的市场空间。

3 数据仓库在高校信息资源建设中的应用

高校都建立了学生管理数据库, 存有大量的学生就业历史数据。如何从这些数据中找出有用的信息, 提供给决策者, 是我们所关心的问题。采用数据挖掘技术是很好的解决方法, 它将已有的一些数据转化为可供使用的知识, 挖掘出与就业有关的高价值信息, 这是一个代开发的“宝藏”[6]。鉴于社会对高等学校发展的需求和目前高等学校数据管理现状, 利用这些数据理性的分析学校各方面工作的成效以及学生培养过程中的得失变得十分重要。

本文将数据挖掘技术引入高等学校教学管理之中, 对本高校近5年来毕业生数据来分析, 发现对学校教学管理、学生管理有用的信息, 提出基于数据挖掘的高校信息资源建设系统。主要包括前台和后台两大部分内容。后台负责分析型应用的数据准备工作, 完成从数据源向数据仓库主题数据的数据变换, 一般称为数据的预处理。前台面向数据仓库的最终用户, 前台需要安装一些分析型应用工具, 协助用户完成主题数据向最终分析结果的数据转变, 例如报表生成器、OLAP工具、数据挖掘工具等, 最终提供分析报告、报表、图形等可视化的分析结果。

4 结语

本文先分析目前高等院校毕业生就业工作, 接着给出数据仓库和数据挖掘的基本概念和相应的信息, 最后在3中结合某高校提出了基于数据挖掘技术的高校信息资源建设系统的结构图。

摘要:随着数据仓库技术的不断发展和广泛应用, 该技术已越来越多的应用于教育管理领域。本文以山东某高校为背景, 采用数据仓库和基于数据仓库的相关技术对现实问题进行有效的模式提取, 从日益加剧的数据中发现隐藏于其后的有效性规律, 从而分析、提取和预测有用的知识, 服务于高校就业信息资源决策, 增强高校的竞争优势。

关键词:数据仓库,数据挖掘,高校就业

参考文献

[1] 王欣.基于数据挖掘的高效学生培养及就业指导研究[C].西安交通大学论文, 2006 (5) .

[2] 胡海员.基于数据仓库的招生辅助决策支持系统研究[J].西南民族大学学报 (人文社科版) , 2005 (7) :338-340.

[3] Olaru C, Wehenkel L.Data mining.Computer Applications in Power, IEEE.1999, 12 (3) , 7:19-25.

[4] Thuraisingham Bhavani.A primer for understanding and applying data mining.IT Professional (2) , Jan.-Feb.2000:28-31.

[5] 官亚雄, 陈卫东.基于数据挖掘的促销决策支持系统[J].浙江工业大学学报, 2006, 34 (2) :174-178.

[6] 王丽珍, 周丽华, 陈红梅, 等.数据仓库与数据挖掘原理及应用[M].科学出版社, 2005.7.

[7] 康振华, 周金刚.数据挖掘在高校就业工作建设中的应用, 现代计算机, 2006 (5) :107-109.

上一篇:自主学习能力在高职英语教学中的培养下一篇:电气自动化控制技术的应用研究