收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于数据仓库的学生成绩分析与研究

李岚  
【摘要】:随着我校研究生院信息化建设工作的开展,研究生综合教务系统已投入使用。但是目前系统中只实现了基本的数据查询和数据备份的功能,分析功能还比较弱,系统中积累了大量学生的数据得不到充分的利用。在这些数据中学生成绩是衡量学生综合素质的一个重要指标,同时也是评估教学质量的一个重要指标,而教学质量的好坏直接反映出学校的综合实力。因此学校的决策人员也更加关心学生成绩的分布情况以及学生成绩的影响因素等信息,从而采取相应的办法来提高教学质量。 因此本文将学生成绩作为分析与研究的对象,首先建立了学生成绩数据仓库。数据仓库的建立过程包括建立三级数据模型以及多维数据集的建立,之后通过EXCEL透视表服务展现了学生成绩的分布情况并得出一些结论。同时为了进行更加深入的研究,引入了决策树分析方法和关联规则分析方法。在确定数据集之后,分别建立了基于ID3算法和C4.5算法的决策树模型,分析学生的基本信息情况对学生成绩的影响,之后使用测试集数据对两种算法的准确率、召回率、F值进行验证并对比了两种算法的实验结果,发现C4.5算法相比于ID3算法准确率更高,而且C4.5算法在决策树的构造过程中就进行剪枝,使创建的决策树叶子结点的个数相对少些,结构也更紧凑些;并且生成的规则更简洁、也更容易被理解,更能满足决策人员的需要。因此根据C4.5算法建立的决策树得出了适用于招生决策的一些结论。 在本校学生的培养方案中,学生学习的课程,是按照公共课、基础理论课、专业基础课的先后顺序进行安排。其中,公共课是基础理论课的基础,基础理论课是专业基础课的基础;前期开设的专业课的学习效果对与之有关联的后期开设的专业课的学习也有很大的影响。因此本文实现了关联规则分析的经典算法—Apriori算法,找出学生公共课、专业基础课、基础理论课成绩之间的关系,并得出一些预测性的结论,同时也为研究生招生工作提供决策支持。


知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978