收藏本站
《华中师范大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

面向大规模在线课程的辍学率预测研究

占高强  
【摘要】:随着互联网和教育大数据的快速发展,大规模在线课程已经越来越普及,国内外都出现了大量的慕课平台,注册人数都达到了上百万,并且平台注册人数会越来越多,但是据调查统计发现课程的完成率普遍低下,关于如何降低慕课平台学习者的辍学率成为亟待研究的问题。尽管大量的学者对该问题进行了理论和预测模型方面的分析,但是研究基础都是基于小样本数据进行研究,很少考虑大数据环境下的时效性。本文基于师大学堂慕课平台研究慕课用户的辍学率问题,在用户行为特征构建和用户辍学率预测模型构建两个方面进行一系列的研究,给出了基于大数据环境慕课用户辍学率预测的新思路,研究的主要内容主要包含下面三个方面:1)基于分布式的权重SVM预测模型基于慕课平台数据量大和实时的特性,分析师大学堂用户的行为数据特性,采用ELK架构设计了慕课平台的数据收集机制,其中Logstash和Elasticsearch都具备良好的可扩展性,随着慕课平台的扩大,数据收集管道也可以扩展,Logstash在数据收集中可以自定义组件对数据进行清洗,结合Elasticsearch和Kibana可以高效的对数据进行存储和统计等操作,根据研究现状和师大平台的用户行为特性分析用户的行为属性,进一步统计用户行为数据,得出用户行为的特征矩阵。基于分布式环境和SVM分类器,设计分布式SVM,并且在此基础之上加入特殊的权重矩阵,对模型的数据进行优化,提高不平衡数据的可识别度,进一步提升模型的准确度和训练效率,其中的核心算法在本文中简称PW-SVM。2)用户特征权重模型和PW-SVM实现由于试验数据具有一定的不均衡特性,为了提高模型的训练效率和准确率,充分分离样本点,使用层次分析法对构建用户特征权重矩阵,再进一步将矩阵加入到分布式SVM模型中。支持向量机(SVM)在训练线性不可分和高纬度等小样本数据时具备良好的效果,在应用到大数据环境下,传统的SVM的计算效率会极大的下降,针对该问题,已有大量文献提出了分布式SVM算法,包括Spark框架中内置了 SVM算法,但是该算法是基于线性分类器设计的,对非线性样本数据训练会存在一定的缺陷,在此基础之上,本文基于分布式P-pack SVM算法和用户权重模型,实现了基于Spark的非线性SVM算法PW-SVM,理论上算法的效率会随着节点的增加而提高。3)实验分析本文最后对模型进行实验分析,实验分析分为两个部分,分别用小样本数据和大样本数据对LibSVM、MllibSVM和PW-SVM做对比实验,在试验之前,先进行试验分析PW-SVM算法的最佳参数。第一组实验结果表明PW-SVM在小样本训练时耗时较长,但是仍然具备一定的准确度,说明了模型的可用性;第二组实验利用数十万的大样本进行对比实验,发现PW-SVM在训练时间上比LibSVM的效率高,并且比MlibSVM中线性的训练方式准确度好,说明在大数据环境下,PW-SVM拥有更好的效果。进一步基于师大学堂的课程行为数据,利用PW-SVM进行训练,由于该数据集具备不均衡的特点,最后发现在添加权重矩阵之后,模型训练收敛的速度回更快,准确率也有相应的提升,说明不均衡数据在经过权重矩阵计算之后,再利用SVM训练会有更好的效果,进一步说明该方法在慕课用户辍学率预测上面有一定的借鉴意义,可以为相关的教学决策作数据支撑。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:G434

【参考文献】
中国期刊全文数据库 前7条
1 周妤婕;;基于沟通策略视角的MOOC高辍学率归因分析[J];学园;2015年33期
2 李思思;钱玲;;对MOOC高辍学率现象的分析与思考[J];中国教育技术装备;2015年22期
3 罗晔;李阿利;;MOOC高辍学率原因及对策分析[J];学理论;2015年05期
4 刁翠霞;陈思凤;刘业政;;基于SVM求解不均衡数据集分类的主观权重约束方法[J];管理工程学报;2012年03期
5 邓雪;李家铭;曾浩健;陈俊羊;赵俊峰;;层次分析法权重计算方法分析及其应用研究[J];数学的实践与认识;2012年07期
6 杜占江;王金娜;肖丹;;构建基于德尔菲法与层次分析法的文献信息资源评价指标体系[J];现代情报;2011年10期
7 丁世飞;齐丙娟;谭红艳;;支持向量机理论与算法研究综述[J];电子科技大学学报;2011年01期
中国硕士学位论文全文数据库 前2条
1 赛金辰;基于Spark的SVM算法优化及其应用[D];北京邮电大学;2017年
2 王俊;DEA模型中的权重确定方法研究[D];中南大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 赵卓阳;冯国阳;张东胜;;基于层次分析法构建危险化学品培训知识内容体系[J];化学教育(中英文);2017年20期
2 余琛琳;崔淑芳;;实验动物从业人员远程培训考核指标体系初探[J];实验动物与比较医学;2017年01期
3 徐龙顺;赵春临;赵敏;;基于支持向量机的驾驶精神疲劳分级[J];武警工程大学学报;2016年06期
4 王朋朋;刘健康;张世文;李祥林;;基于层次分析法的医学生综合素质多级模糊评价研究[J];中华医学教育探索杂志;2016年09期
5 杨婧;沈丽琼;金晓燕;;层次分析法在护理管理领域中的应用进展[J];中华现代护理杂志;2016年26期
6 鲍志超;孙杰;王正;;基于AHP的雷达导引头干扰效果评估研究[J];电子对抗;2016年03期
7 董君;;层次分析法权重计算方法分析及其应用研究[J];科技资讯;2015年29期
8 王佳敏;吴鹏;陈芬;王曰芬;丁晟春;;突发事件中意见领袖的识别和影响力实证研究[J];情报学报;2016年02期
9 靳艳峰;李钢;;基于灰色聚类分析的京津冀城市群层级划分研究[J];北京邮电大学学报(社会科学版);2015年06期
10 马文强;张漫;李忠新;;基于近红外光谱的核桃仁品种快速分类方法[J];农业机械学报;2015年S1期
中国硕士学位论文全文数据库 前10条
1 姚玉婷;义乌市上溪镇美丽乡村精品线乡土特色表达研究[D];浙江农林大学;2018年
2 周静静;城市休闲发展水平研究[D];华中师范大学;2018年
3 占高强;面向大规模在线课程的辍学率预测研究[D];华中师范大学;2018年
4 康可一;基于上市公司的我国旅游产业效率研究[D];江西财经大学;2017年
5 江南一锦;绿色供应链中制造企业的环境绩效分析[D];浙江工业大学;2016年
6 杨康;滑坡灾害危险性评价及救援路径选择[D];山西财经大学;2016年
7 赵增;乳品质量链的耦合效应研究[D];南京财经大学;2016年
8 林航;福州市主城区绿化养护管理的绩效评价研究[D];福建农林大学;2015年
9 李金龙;水电站明钢管安全评估的层次分析法[D];广西大学;2016年
10 韩若苑;基于AHP法的人文旅游资源评价研究[D];西北师范大学;2015年
【二级参考文献】
中国期刊全文数据库 前10条
1 汪基德;冯莹莹;汪滢;;MOOC热背后的冷思考[J];教育研究;2014年09期
2 焦建利;;给慕课学习者的10个建议[J];中国信息技术教育;2013年12期
3 刘晓亮;丁世飞;朱红;张力文;;SVM用于文本分类的适用性[J];计算机工程与科学;2010年06期
4 施其权;李小明;肖辞源;;一类新型快速模糊支持向量机[J];计算机技术与发展;2010年02期
5 过蓓蓓;方兆本;;基于SVM的Web日志挖掘及潜在客户发现[J];管理工程学报;2010年01期
6 孙名松;高庆国;王宣丹;;基于双隶属度模糊支持向量机的邮件过滤[J];计算机工程与应用;2010年02期
7 王文剑;郭虎升;;粒度支持向量机学习模型[J];山西大学学报(自然科学版);2009年04期
8 程伟;张燕平;赵姝;;商空间理论框架下的SVM产量预测模型研究[J];中国农业大学学报;2009年05期
9 张文浩;王文剑;;一种基于关联规则的核粒度支持向量机[J];广西师范大学学报(自然科学版);2009年03期
10 李苗苗;向凤红;刘新旺;;一种新颖隶属度函数的模糊支持向量机[J];计算机工程与科学;2009年09期
【相似文献】
中国期刊全文数据库 前10条
1 陈健;孙庆梅;;青海省农村牧区中小学 春季收费规范 中学生辍学率下降[J];青海统计;2006年09期
2 ;本市初中毕业生届巩固率逐年提高,届辍学率逐年下降[J];北京教育;1997年Z2期
3 道俊;;昭阳区教育局狠抓控辍保学工作[J];云南教育(视界时政版);2017年04期
4 都丽萍;;对辍学率反弹问题的几点认识[J];中小学管理;2005年12期
5 樊树权;农民增收:辍学率何以升高?[J];农村天地;2005年06期
6 郑宏;不能仅用“年辍学率”来评价“控辍”工作[J];中小学管理;2004年01期
7 毕永良;农村初中辍学率回升现象透析[J];中小学管理;2003年12期
8 李守纪;“辍学率受到影响”?[J];语文建设;2003年01期
9 ;1995年与2000年小学生辍学情况比较[J];教育发展研究;2001年12期
10 张武中;中小学生辍学原因的分析与思考[J];青海师专学报;1999年S1期
中国重要会议论文全文数据库 前10条
1 袁宇迪;;让孩子带着期盼去上学[A];2016年国家教师科研专项基金科研成果[C];2016年
2 简荣华;;山区初中学生辍学的原因及对策[A];中华教育理论与实践科研论文成果选编(第2卷)[C];2010年
3 杨奎;;搞好寄宿学校管理有利于控辍保学[A];中华教育理论与实践科研论文成果选编(第1卷)[C];2009年
4 金延春;;再谈实质性解决“控辍”问题的思路与对策[A];创新沈阳文集(B)[C];2009年
5 夏成元;;马关县壮族、苗族学生“辍学”情况的调研与思考[A];全国教育科研“十五”成果论文集(第一卷)[C];2005年
6 黄彤哲;;中小学辍学原因及对策[A];全国教育科研“十五”成果论文集(第一卷)[C];2005年
7 刘海涛;聂衍刚;;大学生无聊倾向与网络成瘾、人格特质的相关研究[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
8 姚延芹;;武汉市“流动儿童”义务教育状况调查——从“上学难”到“上好学校难”转变的思考[A];2007年中国教育经济学年会会议论文集[C];2007年
9 麻付上;;农村初中生流失原因初探[A];基础教育理论研究成果荟萃(中)[C];2006年
10 陈明昆;张晓楠;姚娇娇;;埃塞俄比亚初等教育发展取得的成就及面临的问题与挑战[A];非洲研究2017年第1卷(总第10卷)[C];2017年
中国重要报纸全文数据库 前10条
1 记者 韦继川 通讯员 郭超前;江南区建档立卡学生辍学率降零[N];广西日报;2019年
2 中国教育科学研究院高等教育研究中心博士 姜朝晖;“慕课”高辍学率亦不妨理性看待[N];中国教育报;2014年
3 本报记者 赵婀娜 张烁;辍学率低于国家控制线[N];人民日报;2012年
4 华东师大发展规划办公室及教育管理学系教授 文新华;小学辍学率大大低于十年前[N];中国教育报;2013年
5 新华社记者 王进业 文远竹;警惕:农村辍学率上升[N];中国教育报;2001年
6 民进中央副主席 王立平;努力降低农村初中辍学率[N];光明日报;2001年
7 旅美华人 山石;美国学生辍学率为何“雷人”的高?[N];新华每日电讯;2011年
8 耿 汉;由40%的高辍学率想到……[N];中国信息报;2004年
9 湖北省南漳县政协 李传友;2104名初中生为何辍学了[N];人民政协报;2001年
10 ;一个都不能少[N];人民政协报;2005年
中国硕士学位论文全文数据库 前10条
1 占高强;面向大规模在线课程的辍学率预测研究[D];华中师范大学;2018年
2 刘小红;中职生辍学成因及其教育对策研究[D];上海师范大学;2010年
3 刘原媛;民族地区初中生辍学原因分析及对策[D];四川师范大学;2013年
4 叶小红;农村普通高中辍学现象的调查与分析[D];华中师范大学;2006年
5 王静;信阳市职业高中隐性辍学的成因及对策研究[D];华中师范大学;2012年
6 孙远;庄河农村初中生辍学现状的调查分析及对策[D];辽宁师范大学;2006年
7 陈林;基层电大现代远程教育辍学情况探究[D];华中师范大学;2006年
8 伍琪;基于马斯洛需要层次理论的农村中学生辍学原因分析与对策研究[D];四川师范大学;2017年
9 陈凤;温江区中职学生辍学原因及对策研究[D];四川师范大学;2014年
10 刘露阳;美国学院高中项目研究[D];东北师范大学;2013年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026