收藏本站
《安徽大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘在高职院校学生成绩分析中的应用

刘华敏  
【摘要】:伴随着中国高等教育的快速发展,高等职业教育进入高速发展期。民办高等职业教育在这个时期急剧扩张,招生规模的扩大和教师队伍的膨胀带来一系列的问题,在这些问题中,如何保证教学质量是重中之重。找出与学生成绩有关因素不但对改进课堂教学可教育管理具有指导作用,而且对保证教学质量也有重要意义。 应用数据挖掘技术对学生成绩数据库进行分析,探索哪些因素与学生成绩有关,能为课程设置、课堂教学及教育管理提供参考意见。数据挖掘被定义为从大量有噪声模糊的、不完全的、随机的数据中提取隐藏在其中未知但又是肯定存在的,具有一定价值的信息和知识的过程。在数据挖掘过程中通常需要面向决策支持系统和联机分析应用数据源的结构化数据环境,即数据仓库;分类是指把某个不连续的标识值分配给一个未标识的记录的过程。决策树是应用最广的分类算法之一。ID3算法是决策树分类的经典算法,应用信息增益作为创建决策树的基本指标,C4.5算法是在ID3算法基础上进行改进的决策树算法,应用信息增益率来进行属性分裂。但是C4.5涉及对数运算,过程相对复杂且计算量大,因此本文引用了一种改进的C4.5算法,它应用数学上的等价无穷小的理论对C4.5算法进行改进,改进后的算法只需要进行加减乘除运算,简化了计算过程,提高了计算速度,从而提升决策树的建树效率。实践表明,C4.5算法创建的决策树弥补了ID3算法倾向于选择取值多的属性的不足,创建的决策树转化为If-Then语句更规范,更能满足决策者的要求;C4.5算法在构造决策树的过程中不断的进行剪枝,创建的决策树叶子节点相对较少,结构紧凑;改进的C4.5算法只需要进行加减乘除计算,简化了计算量和计算复杂度,提高了运算速度,从而提升了建树效率。 本文首先对数据仓库、数据挖掘、分类技术基本知识进行了阐述;其次,采用SQL Server 2005 Analysis Service对学生成绩数据进行多维数据的创建,结合安徽文达信息工程学院学生成绩管理系统,创建了以学生成绩事实表为核心的数据仓库,主要内容涵盖学生成绩数据仓库的逻辑模型设计、物理模型的建立以及数据的整合、加工和分析;最后对ID3和C4.5算法进行了详细的介绍,结合安徽文达信息工程学院学生成绩管理系统,应用决策树算法中典型的ID3算法、C4.5算法及改进的C4.5算 法对学生成数据进行挖掘,分别生成决策树,转化成分类规则,发现隐藏在学生成绩数据背后的,对教育教学有指导意义的规律。
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13

【引证文献】
中国硕士学位论文全文数据库 前1条
1 庄小叶;高职院校智能组卷考试与成绩管理分析系统研究设计[D];山东大学;2012年
【参考文献】
中国期刊全文数据库 前5条
1 李强;;创建决策树算法的比较研究——ID3,C4.5,C5.0算法的比较[J];甘肃科学学报;2006年04期
2 王国胤,何晓;一种不确定性条件下的自主式知识学习模型[J];软件学报;2003年06期
3 刘小虎,李生;决策树的优化算法[J];软件学报;1998年10期
4 宜建军;;基于Web数据挖掘的图书馆UIS系统设计与实现[J];现代情报;2006年03期
5 赵卫东,李旗号;粗集在决策树优化中的应用[J];系统工程学报;2001年04期
中国硕士学位论文全文数据库 前8条
1 万铮;基于数据仓库的OLAP系统的设计与实现[D];西南交通大学;2005年
2 姜晚云;关联规则在学生成绩管理中的应用研究[D];合肥工业大学;2006年
3 李艳杰;数据挖掘在山东商职学院教学科研管理中的应用研究[D];山东大学;2006年
4 杨华;数据挖掘技术在人寿保险业务中的研究和应用[D];西安电子科技大学;2007年
5 刘静宜;数据挖掘在职教系统的应用[D];中国海洋大学;2009年
6 陈晓玲;数据挖掘在学分制成绩管理中的应用研究[D];中南大学;2009年
7 牛文颖;改进的ID3决策树分类算法在成绩分析中的应用研究[D];大连交通大学;2008年
8 杜聪;数据挖掘技术在科研评价系统中应用研究[D];山东大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 秦洪英;数据挖掘在网络业务流设计中的实现过程[J];阿坝师范高等专科学校学报;2005年03期
2 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
3 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
4 宋平平;;基于数据挖掘的智能入侵检测系统模型及实现[J];安徽工程科技学院学报(自然科学版);2006年03期
5 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
6 李岚;胡学钢;;基于回归分析的COCOMO模型改进[J];安徽建筑工业学院学报(自然科学版);2010年06期
7 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
8 陈志民;李亭;杨敬锋;彭晓琴;;珠海市斗门区水产品病害网络诊断与防治系统算法设计[J];安徽农业科学;2010年17期
9 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
10 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
3 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
4 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论和Apriori算法建立中医症候诊断标准[A];中国自动化学会控制理论专业委员会D卷[C];2011年
5 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
6 赵云鹏;石丽;刘莹;;基于数据挖掘的高校规模分析及应用研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
7 王伟珍;刘春红;张漫;李民赞;刘刚;;基于BP神经网络的温室番茄光合作用速率预测模型研究[A];中国农业工程学会2011年学术年会论文集[C];2011年
8 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
9 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
10 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
中国硕士学位论文全文数据库 前10条
1 汤雪;时间序列线性表示方法及其相似性度量算法研究[D];山东科技大学;2010年
2 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
3 解保忠;计算机在矽肺病早期诊断及预测中的应用研究[D];哈尔滨工程大学;2010年
4 李威;多参数扰动的隐私保护关联规则挖掘算法研究[D];哈尔滨工程大学;2010年
5 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
6 王勇;一种面向隐私保护的分布式数据流挖掘算法[D];哈尔滨工程大学;2010年
7 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年
8 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
9 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
10 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前3条
1 李强;;创建决策树算法的比较研究——ID3,C4.5,C5.0算法的比较[J];甘肃科学学报;2006年04期
2 肖成林,徐清振;基于遗传算法的成卷策略的设计与实现[J];现代计算机(专业版);2003年08期
3 张琦;郑河荣;刘志;陈云泽;;基于优化遗传算法的智能组卷系统研究[J];浙江工业大学学报;2009年03期
中国硕士学位论文全文数据库 前7条
1 文娴;试题库系统智能组卷与试卷分析的研究[D];湖南师范大学;2007年
2 郭素蓉;学校通用考试系统的设计与实现[D];电子科技大学;2007年
3 吴树锦;基于遗传算法智能组卷系统的研究与实现[D];华东师范大学;2008年
4 张义良;基于遗传算法的网络智能考试系统的研究与实现[D];湖南大学;2008年
5 黄爱辉;基于决策树算法的考试成绩分析系统的研究与开发[D];湖南大学;2008年
6 牛文颖;改进的ID3决策树分类算法在成绩分析中的应用研究[D];大连交通大学;2008年
7 刘硕;基于改进遗传算法的组卷系统的研究[D];吉林大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 赵宇海,李秋菊;关系数据库中OLAP系统的分析与设计[J];鞍山师范学院学报;2005年04期
2 周志逵,徐先传;数据仓库中数据抽取、转换及加载工具研究[J];北京理工大学学报;2003年06期
3 于淘;;高校学分制改革现状分析及思考[J];兵团教育学院学报;2007年05期
4 王红睿;赵黎明;裴剑;;均衡化的改进K均值聚类法[J];吉林大学学报(信息科学版);2006年02期
5 刘雨露;;数据挖掘在高校学生管理决策中的应用模式分析[J];成都信息工程学院学报;2006年03期
6 陈永强,胡雷芳;数据挖掘技术在人寿保险CRM系统中的应用研究[J];成组技术与生产现代化;2004年01期
7 赵晓煜;黄小原;;基于数据挖掘的客户价值预测方法[J];东北大学学报;2006年12期
8 韦洛霞;数据仓库与OLAP[J];东莞理工学院学报;2000年02期
9 唐晓萍;数据挖掘与知识发现综述[J];电脑开发与应用;2002年04期
10 何彤宇,林筑英,张仁津;数据仓库技术在教育领域中的应用[J];电脑开发与应用;2003年04期
中国硕士学位论文全文数据库 前5条
1 许睿;联机分析处理及其在商业自动化中的应用[D];重庆大学;2002年
2 王欣;基于数据挖掘的高校学生培养及就业指导研究[D];西南交通大学;2006年
3 蒋文杰;一体化智能教学网络平台[D];电子科技大学;2007年
4 司晓梅;数据挖掘中关联规则的研究及应用[D];武汉理工大学;2007年
5 卢晶晶;基于数据挖掘的教学评价系统[D];河海大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 张丽;;数据仓库与数据挖掘[J];贵州民族学院学报(哲学社会科学版);2006年02期
2 费江波;;分析型CRM中数据仓库的设计与实现[J];科技经济市场;2007年01期
3 刘志民;;企业数据仓库的设计与实现[J];硅谷;2008年14期
4 麦永浩;杨超;;公安数据仓库和数据挖掘应用研究[J];警察技术;2009年02期
5 谭春曦;;数据仓库在数字图书馆中的作用[J];硅谷;2010年21期
6 王栋;向阳;张波;;本体在数据挖掘系统中的应用研究[J];计算机工程与应用;2009年05期
7 马宏斌;陈红;丁群;王积祥;;虚拟实验室数据仓库管理[J];实验室研究与探索;2006年11期
8 张剑;;数据挖掘在医院信息系统中的简单应用[J];医学信息;2008年03期
9 朱伟军;;数据仓库在海关统计中的实践与应用[J];知识经济;2009年10期
10 陈凤美;;数据仓库在电子商务中的应用研究[J];太原师范学院学报(自然科学版);2010年04期
中国重要会议论文全文数据库 前10条
1 温国锋;李宏艳;王广成;王永生;王成华;马立强;王敏;张巍巍;宁丰荣;岱云;;数据仓库与粗集数据挖掘在建筑管理决策中的应用研究[A];决策与管理研究(2007-2008)——山东省软科学计划优秀成果汇编(第七册·上)[C];2009年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
4 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
5 肖健;刘杨;沈彩霞;;商业智能(BI)的行业应用[A];广西计算机学会2008年年会论文集[C];2008年
6 曹波伟;薛青;郑长伟;于屏岗;陈辰;;基于数据挖掘的装备维修管理智能分析模型研究[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
7 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
8 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
9 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
10 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
中国重要报纸全文数据库 前10条
1 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
2 张立明;数据挖掘之道[N];网络世界;2003年
3 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
4 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
5 裴维玲;呼叫中心与数据挖掘,谁先上?[N];网络世界;2001年
6 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
7 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
8 吴勇毅;危机下,数据挖掘与提供信息决策是关健[N];中国冶金报;2009年
9 李立红 朱进;承钢数据挖掘系统建设项目正式实施[N];中国冶金报;2005年
10 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
中国博士学位论文全文数据库 前10条
1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
2 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
3 韩颖;新型农村合作医疗数据挖掘研究[D];山西医科大学;2009年
4 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
5 李广水;基于服务的森林资源调查数据挖掘系统的研究[D];南京林业大学;2010年
6 李智勇;电力系统运行信息的数据挖掘研究[D];浙江大学;2009年
7 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
8 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
9 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
10 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘华敏;数据挖掘在高职院校学生成绩分析中的应用[D];安徽大学;2011年
2 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
3 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
4 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
5 年爱华;数据挖掘在职校普通话等级考试成绩分析中的应用[D];兰州大学;2010年
6 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
7 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
8 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
9 全姣;政府采购资金使用数据挖掘研究[D];重庆理工大学;2011年
10 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026