学生成绩的关联分析

2023-01-28

1 引言

高校学生的考试成绩能客观地反映出学生掌握知识的程度。学校的数据库中保存有大量的成绩数据, 目前还没有对这些数据进行深入的分析, 尚未探索到这些数据下隐藏的规律。数据挖掘DM (Data Mining) 又称数据库中的知识发现 (Knowledge Discovery in Database) , 已被认为是数据库研究领域中一个极富应用前景的新领域, 而关联规则 (Association Rules) 的挖掘又是DM中最活跃和开展得较深入的一个分支。本文运用关联规则中的Apriori算法, 对学生考试成绩数据库进行挖掘。揭示课程之间的潜在关系, 为课程设置及学生管理工作提供决策支持。

2 数据挖掘数据库

所要挖掘的数据库为供电3161班所有学生在某一学期的四门考试课课程成绩。部分学生成绩如表1, 其中所选的四门课程为:高等数学、电工基础、电子技术、英语。这四门课的成绩来源于学校教务管理系统, 其真实有效。本文利用SPSS Modeler中的Apriori算法来研究某一门课程对另一门课程的影响, 通过课程成绩之间的关联程度分析学生学习状况。

3 数据预处理

表1中的数据是数量型的数据, Aprirori算法适用的数据是布尔属性的, 为此在挖掘之前需要将数量属性的数据集离散化成布尔属性数据集。把学生每一科的成绩分成四个等级:80~100是第1级, 70~79是第2级, 60~69是第3级, 0~59是第4级。并将课程进行编号, 电工测量记为D, 电工基础记为C, 高等数学记为M, 英语记为E。例如一位学生的高等数学为94.2分, 离散化成M1, 电工测量60.6, 离散化成D4。按此方法, 把每一个学生的四门课的成绩进行离散化处理, 处理的部分结果如表2所示。

4 规则挖掘

利用SPSS Modeler中的Apriori模型对离散化的学生成绩数据集进行规则挖掘[1]。数据流如图1所示。将Apriori节点中的最低条件支持度设置为8.0%, 最小规则置信度设置为80%, 最大前项数设置为2项。所挖掘的规则如表3所示。网状图如图1所示。

5 结语

综上所述, 对提取的部分规则进行分析, 规则1 (C1, M1) 说明电工基础成绩为优秀的学生高等数学的成绩也是优秀, 该规则的支持度为8.108%, 置信度为100%。这条规则揭示了高等数学的学习对电工基础的有密切的关联度, 这两门课的代课老师在教学上应该多交流沟通, 教授电工基础的老师应该提醒学生不能轻视高等数学的学习, 教授高等数学的老师应该鼓励学生认真学习高等数学为专业基础课的学习打好基础。规则5说明高数与电工基础成绩不好的同学, 电工测量的成绩也不好。高数与电工基础的学习对电工测量有着很大的影响。

摘要:关联规则是数据挖掘的主要工具之一, 能够有效揭示数据中隐含的关联特征。本文运用关联规则的Apriori算法, 以班级学生四门课的成绩为对象, 以SPSS MODELER软件为工具, 挖掘课程之间的内在联系, 为学生管理、课程设置提供理论参考。

关键词:关联规则,Apriori学生成绩分析

参考文献

[1] 薛薇, 陈欢歌.SPSS Modeler数据挖掘方法与应用[M].北京:电子工业出版社, 2014 (1) .[1]薛薇, 陈欢歌.SPSS Modeler数据挖掘方法与应用[M].北京:电子工业出版社, 2014 (1) .

上一篇:中学地理教学语言的艺术特征下一篇:关爱儿童公益动画短片制作与研究