收藏本站
《安徽大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘在高职院校学生成绩分析中的应用

刘华敏  
【摘要】:伴随着中国高等教育的快速发展,高等职业教育进入高速发展期。民办高等职业教育在这个时期急剧扩张,招生规模的扩大和教师队伍的膨胀带来一系列的问题,在这些问题中,如何保证教学质量是重中之重。找出与学生成绩有关因素不但对改进课堂教学可教育管理具有指导作用,而且对保证教学质量也有重要意义。 应用数据挖掘技术对学生成绩数据库进行分析,探索哪些因素与学生成绩有关,能为课程设置、课堂教学及教育管理提供参考意见。数据挖掘被定义为从大量有噪声模糊的、不完全的、随机的数据中提取隐藏在其中未知但又是肯定存在的,具有一定价值的信息和知识的过程。在数据挖掘过程中通常需要面向决策支持系统和联机分析应用数据源的结构化数据环境,即数据仓库;分类是指把某个不连续的标识值分配给一个未标识的记录的过程。决策树是应用最广的分类算法之一。ID3算法是决策树分类的经典算法,应用信息增益作为创建决策树的基本指标,C4.5算法是在ID3算法基础上进行改进的决策树算法,应用信息增益率来进行属性分裂。但是C4.5涉及对数运算,过程相对复杂且计算量大,因此本文引用了一种改进的C4.5算法,它应用数学上的等价无穷小的理论对C4.5算法进行改进,改进后的算法只需要进行加减乘除运算,简化了计算过程,提高了计算速度,从而提升决策树的建树效率。实践表明,C4.5算法创建的决策树弥补了ID3算法倾向于选择取值多的属性的不足,创建的决策树转化为If-Then语句更规范,更能满足决策者的要求;C4.5算法在构造决策树的过程中不断的进行剪枝,创建的决策树叶子节点相对较少,结构紧凑;改进的C4.5算法只需要进行加减乘除计算,简化了计算量和计算复杂度,提高了运算速度,从而提升了建树效率。 本文首先对数据仓库、数据挖掘、分类技术基本知识进行了阐述;其次,采用SQL Server 2005 Analysis Service对学生成绩数据进行多维数据的创建,结合安徽文达信息工程学院学生成绩管理系统,创建了以学生成绩事实表为核心的数据仓库,主要内容涵盖学生成绩数据仓库的逻辑模型设计、物理模型的建立以及数据的整合、加工和分析;最后对ID3和C4.5算法进行了详细的介绍,结合安徽文达信息工程学院学生成绩管理系统,应用决策树算法中典型的ID3算法、C4.5算法及改进的C4.5算 法对学生成数据进行挖掘,分别生成决策树,转化成分类规则,发现隐藏在学生成绩数据背后的,对教育教学有指导意义的规律。
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13

免费申请
【引证文献】
中国硕士学位论文全文数据库 前1条
1 庄小叶;高职院校智能组卷考试与成绩管理分析系统研究设计[D];山东大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 李强;;创建决策树算法的比较研究——ID3,C4.5,C5.0算法的比较[J];甘肃科学学报;2006年04期
2 钟鸣,刘晓霞,陈文伟;示例学习算法IBLE和ID_3的比较研究[J];计算机研究与发展;1993年01期
3 周志华,葛翔,陈兆乾;构造性混合决策树[J];计算机学报;2001年10期
4 洪家荣,丁明峰,李星原,王丽薇;一种新的决策树归纳学习算法[J];计算机学报;1995年06期
5 菅志刚,金旭;数据挖掘中数据预处理的研究与实现[J];计算机应用研究;2004年07期
6 黄爱辉;;决策树C4.5算法的改进及应用[J];科学技术与工程;2009年01期
7 王国胤,何晓;一种不确定性条件下的自主式知识学习模型[J];软件学报;2003年06期
8 刘小虎,李生;决策树的优化算法[J];软件学报;1998年10期
9 宜建军;;基于Web数据挖掘的图书馆UIS系统设计与实现[J];现代情报;2006年03期
10 赵卫东,李旗号;粗集在决策树优化中的应用[J];系统工程学报;2001年04期
中国博士学位论文全文数据库 前1条
1 李锋;面向数据挖掘的隐私保护方法研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前8条
1 万铮;基于数据仓库的OLAP系统的设计与实现[D];西南交通大学;2005年
2 姜晚云;关联规则在学生成绩管理中的应用研究[D];合肥工业大学;2006年
3 李艳杰;数据挖掘在山东商职学院教学科研管理中的应用研究[D];山东大学;2006年
4 杨华;数据挖掘技术在人寿保险业务中的研究和应用[D];西安电子科技大学;2007年
5 刘静宜;数据挖掘在职教系统的应用[D];中国海洋大学;2009年
6 陈晓玲;数据挖掘在学分制成绩管理中的应用研究[D];中南大学;2009年
7 牛文颖;改进的ID3决策树分类算法在成绩分析中的应用研究[D];大连交通大学;2008年
8 杜聪;数据挖掘技术在科研评价系统中应用研究[D];山东大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 秦洪英;数据挖掘在网络业务流设计中的实现过程[J];阿坝师范高等专科学校学报;2005年03期
2 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
3 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
4 宋平平;;基于数据挖掘的智能入侵检测系统模型及实现[J];安徽工程科技学院学报(自然科学版);2006年03期
5 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
6 李岚;胡学钢;;基于回归分析的COCOMO模型改进[J];安徽建筑工业学院学报(自然科学版);2010年06期
7 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
8 陈志民;李亭;杨敬锋;彭晓琴;;珠海市斗门区水产品病害网络诊断与防治系统算法设计[J];安徽农业科学;2010年17期
9 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
10 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
3 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
4 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论和Apriori算法建立中医症候诊断标准[A];中国自动化学会控制理论专业委员会D卷[C];2011年
5 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
6 赵云鹏;石丽;刘莹;;基于数据挖掘的高校规模分析及应用研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
7 王伟珍;刘春红;张漫;李民赞;刘刚;;基于BP神经网络的温室番茄光合作用速率预测模型研究[A];中国农业工程学会2011年学术年会论文集[C];2011年
8 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
9 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
10 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
3 王俊杰;基于ArcGIS Server的震害风险管理系统研究[D];中国海洋大学;2010年
4 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
5 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
6 罗彬;基于MMOI方法的电信客户流失预测与挽留研究[D];电子科技大学;2010年
7 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
8 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
9 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
10 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 汤雪;时间序列线性表示方法及其相似性度量算法研究[D];山东科技大学;2010年
2 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
3 解保忠;计算机在矽肺病早期诊断及预测中的应用研究[D];哈尔滨工程大学;2010年
4 李威;多参数扰动的隐私保护关联规则挖掘算法研究[D];哈尔滨工程大学;2010年
5 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
6 王勇;一种面向隐私保护的分布式数据流挖掘算法[D];哈尔滨工程大学;2010年
7 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年
8 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
9 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
10 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前6条
1 李强;;创建决策树算法的比较研究——ID3,C4.5,C5.0算法的比较[J];甘肃科学学报;2006年04期
2 魏萍萍,王翠茹,王保义,张振兴;数据挖掘技术及其在高校教学系统中的应用[J];计算机工程;2003年11期
3 李苗在;决策树技术在学生考试成绩数据库中的应用[J];教育信息化;2005年06期
4 刘小虎,李生;决策树的优化算法[J];软件学报;1998年10期
5 肖成林,徐清振;基于遗传算法的成卷策略的设计与实现[J];现代计算机(专业版);2003年08期
6 张琦;郑河荣;刘志;陈云泽;;基于优化遗传算法的智能组卷系统研究[J];浙江工业大学学报;2009年03期
中国硕士学位论文全文数据库 前8条
1 文娴;试题库系统智能组卷与试卷分析的研究[D];湖南师范大学;2007年
2 郭素蓉;学校通用考试系统的设计与实现[D];电子科技大学;2007年
3 吴树锦;基于遗传算法智能组卷系统的研究与实现[D];华东师范大学;2008年
4 张义良;基于遗传算法的网络智能考试系统的研究与实现[D];湖南大学;2008年
5 黄爱辉;基于决策树算法的考试成绩分析系统的研究与开发[D];湖南大学;2008年
6 朱近贤;数据挖掘技术在人力资源管理中的应用研究[D];上海交通大学;2008年
7 牛文颖;改进的ID3决策树分类算法在成绩分析中的应用研究[D];大连交通大学;2008年
8 刘硕;基于改进遗传算法的组卷系统的研究[D];吉林大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 赵宇海,李秋菊;关系数据库中OLAP系统的分析与设计[J];鞍山师范学院学报;2005年04期
2 周志逵,徐先传;数据仓库中数据抽取、转换及加载工具研究[J];北京理工大学学报;2003年06期
3 于淘;;高校学分制改革现状分析及思考[J];兵团教育学院学报;2007年05期
4 王红睿;赵黎明;裴剑;;均衡化的改进K均值聚类法[J];吉林大学学报(信息科学版);2006年02期
5 刘雨露;;数据挖掘在高校学生管理决策中的应用模式分析[J];成都信息工程学院学报;2006年03期
6 陈永强,胡雷芳;数据挖掘技术在人寿保险CRM系统中的应用研究[J];成组技术与生产现代化;2004年01期
7 赵晓煜;黄小原;;基于数据挖掘的客户价值预测方法[J];东北大学学报;2006年12期
8 韦洛霞;数据仓库与OLAP[J];东莞理工学院学报;2000年02期
9 唐晓萍;数据挖掘与知识发现综述[J];电脑开发与应用;2002年04期
10 何彤宇,林筑英,张仁津;数据仓库技术在教育领域中的应用[J];电脑开发与应用;2003年04期
中国硕士学位论文全文数据库 前5条
1 许睿;联机分析处理及其在商业自动化中的应用[D];重庆大学;2002年
2 王欣;基于数据挖掘的高校学生培养及就业指导研究[D];西南交通大学;2006年
3 蒋文杰;一体化智能教学网络平台[D];电子科技大学;2007年
4 司晓梅;数据挖掘中关联规则的研究及应用[D];武汉理工大学;2007年
5 卢晶晶;基于数据挖掘的教学评价系统[D];河海大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 刘桂霞,崔永铎,高平和;关于数据挖掘的研究[J];工业技术经济;2000年03期
2 李业丽,常桂然,徐茜;神经网络在数据挖掘中的应用研究[J];计算机工程与应用;2000年08期
3 陈国萍,李巍,刘仲英;数据挖掘中概念树的标准、生成和实现[J];计算机工程;2000年12期
4 朱天翔,李力;相关案件的数据挖掘[J];计算机应用研究;2000年03期
5 赵丹群;数据挖掘:原理、方法及其应用[J];现代图书情报技术;2000年06期
6 余英泽,廖里,吴渝;一种新型数据分析技术——数据挖掘[J];计算机与现代化;2000年01期
7 邵华 ,万家华 ,金翔义;数据挖掘在证券行业中的应用[J];软件工程师;2000年11期
8 王宏;数据挖掘在网络营销中的应用[J];计算机应用与软件;2000年06期
9 何东峰;数据挖掘要适当[J];互联网周刊;2000年Z1期
10 康松林,费洪晓;数据挖掘的软分类方法[J];长沙铁道学院学报;2001年03期
中国重要会议论文全文数据库 前10条
1 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
2 李久丹;陈剑;覃涛;;数据挖掘技术理论研究[A];广西计算机学会2010年学术年会论文集[C];2010年
3 张秋彤;;数据挖掘与高校图书馆个性化信息服务[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年
4 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
5 毛定祥;;数据挖掘与实证经济学[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
6 段培俊;周东岱;;数据挖掘研究综述[A];2003年中国智能自动化会议论文集(下册)[C];2003年
7 雷宇;;论行业信息资源的数据挖掘[A];中国烟草行业信息化研讨会论文集[C];2004年
8 吴以凡;吴铁军;欧阳树生;;面向生产过程质量控制的动态数据挖掘方法[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年
9 孙明;康红梅;莫一;;数据挖掘在科技奖励管理系统专家库中的应用[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年
10 邵红全;杨菊梅;潘建雄;;数据挖掘的策略与实现技术[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
中国博士学位论文全文数据库 前10条
1 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
2 巩建光;面向电信领域的数据挖掘关键技术研究[D];哈尔滨工程大学;2012年
3 李建强;基于数据挖掘的电站运行优化理论研究与应用[D];华北电力大学(河北);2006年
4 余小高;电子商务环境中分布式数据挖掘的研究[D];武汉理工大学;2007年
5 李国旗;本体辅助的先验知识融入生物信息数据挖掘的方法研究[D];上海交通大学;2007年
6 翟坤;基于数据挖掘的成本管理方法研究[D];大连理工大学;2012年
7 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
8 刘洪波;汉语认知脑数据挖掘相关算法及应用研究[D];大连理工大学;2006年
9 朱廷劭;数据挖掘及其在汉语文语转换中应用的研究[D];中国科学院研究生院(计算技术研究所);1999年
10 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
中国硕士学位论文全文数据库 前10条
1 杨毅超;基于Web数据挖掘的作物商务平台分析与研究[D];湖南农业大学;2008年
2 徐进华;基于灰色系统理论的数据挖掘及其模型研究[D];北京交通大学;2009年
3 俞驰;基于网络数据挖掘的客户获取系统研究[D];西安电子科技大学;2009年
4 冯军;数据挖掘在自动外呼系统中的应用[D];北京邮电大学;2009年
5 于宝华;基于数据挖掘的高考数据分析[D];天津大学;2009年
6 王仁彦;数据挖掘与网站运营管理[D];华东师范大学;2010年
7 彭智军;数据挖掘的若干新方法及其在我国证券市场中应用[D];重庆大学;2005年
8 涂继亮;基于数据挖掘的智能客户关系管理系统研究[D];哈尔滨理工大学;2005年
9 贾治国;数据挖掘在高考填报志愿上的应用[D];内蒙古大学;2005年
10 马飞;基于数据挖掘的航运市场预测系统设计及研究[D];大连海事大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026