收藏本站
《武汉大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

面向大数据分析的多任务加速在线学习算法研究

李志杰  
【摘要】:大数据时代,越来越多的领域出现了对海量、高速数据进行实时处理的需求。如何对大数据流进行抽取转化成有用的信息并应用于各行各业,变得越来越重要。传统的批量机器学习技术在大数据分析的应用中存在许多限制。在线学习技术采用流式计算模式,在内存中直接进行数据的实时计算,为流数据的学习提供了有利的工具。目前在机器学习领域,已经提出大量的在线学习算法。这些在线学习算法主要包括三方面:1)线性模型在线学习;2)基于核的非线性模型在线学习;3)非传统的在线学习方法。线性模型在线学习和基于核的非线性模型在线学习,是经典的在线学习方法。非传统的在线学习方法则是近几年提出的最新的在线学习方法,这种在线学习算法很有希望更好地解决各种大数据挖掘任务面临的困难与挑战。论文首先介绍大数据分析的动机与背景,概述了在线学习算法的现状及研究的关键问题。随后,本文详细地研究了几种非传统的在线学习方法及其在大数据分析中的应用,主要工作包括:(1)提出一种多任务加速在线学习算法,并应用于大规模协同过滤分解用户与物品矩阵。传统的在线学习是单任务形式的,学习目标是权重向量。并且,在线学习算法收敛率低,一般仅为O(1/√T),T为算法迭代次数。针对这一问题,本文通过对多个任务同时学习的方式,获得比单任务学习更优的性能。算法的加速采用一种改进的微批量技术,收敛率达到O(1/T2)。多任务加速在线学习算法,直接应用于大规模协同过滤分解用户与物品矩阵,实验表明学习性能优良。(2)提出一种组LASSO加速在线学习算法,组LASSO模型常用于生物信息分析等领域。传统的批处理组LASSO算法存在低效率和扩展性差的缺陷。针对这一问题,本文提出一种稀疏组LASSO加速在线学习算法。稀疏组LASSO模型能同时提高分组和单个特征水平上的稀疏性。我们对提出算法的加速收敛性进行了详细的理论分析。同时,对组LASSO权重学习向量wt的迭代闭式解表达式进行了推导,保证了每次迭代的时间复杂度和存储代价均为O(d),d是特征个数。人工和实际数据集上的实验验证了该算法优良的实时性和可扩展性能。(3)提出一种基于非线性组LASSO模型的在线多核学习算法,并对算法的收敛率与错误界进行了分析。动态变化的流数据来源广泛,模型复杂,单个最优核学习方法往往难以满足需求。针对这一问题,本文通过组LASSO与多核学习的一致性得到最优核权重的闭式解,导出多核学习的非线性组LASSO模型。提出的算法中,应用随机梯度下降法求解该模型并采用截取近似技术,以应对核扩展问题和提高收敛速度。同时,本文研究了不平衡的核在线学习问题,该问题广泛存在于监视系统的不正常行为,信用卡交易的欺诈,在线广告/新闻的点击/浏览行为等领域。(4)提出一种基于多样性增量的生物相似性二次判别分析方法,并应用于基因剪切位点在线分析预测算法。传统的批处理模式显然不合适于海量的基因测序大数据分析。同时,生物信息分析为了发现统计学上有意义的结果,往往需要把这些测序得到的短碱基序列与已有的基因组或相近的物种基因组序列进行比对。针对这一问题,本文依据基因剪切信号处的碱基保守性和关联统计特征得到多样性源,并利用多样性增量定量表示生物相似性关系。同时,通过在线学习算法实现基于多个多样性增量的二次剪切位点判别分析法,在基因测序大数据的生物信息分析领域有较好的推广应用价值。
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP311.13;TP181

【相似文献】
中国期刊全文数据库 前10条
1 李红美;;论网络教育环境下学习者学习动机的激发[J];继续教育;2006年11期
2 李秀英;;网络环境下学生学习的特点[J];教师;2009年04期
3 夏定海,黄智英;教会学习 学会学习 终身学习[J];发明与革新;2000年06期
4 黄启兵;汪芳;;论网络时代学习与创新的统一[J];教学研究;2002年03期
5 陈相安;把档案部门建成学习型组织[J];中国档案;2003年09期
6 顾新,蔡兵,李久平;学习与学习型社会[J];软科学;2004年02期
7 郑军;试论编辑的学习特征[J];中国编辑;2005年06期
8 邱晓荣,孔一童;试论网络环境中的合作学习[J];当代教育论坛;2005年02期
9 冷平,王仁蓉,刁永锋;网络学习的成功要素探析[J];教育信息化;2005年03期
10 张建光;朱秀娥;张笑双;;网络学习社区的特征和构建[J];中国教育技术装备;2006年03期
中国重要会议论文全文数据库 前10条
1 韩文;;让合作学习在逆境中重生[A];中华教育理论与实践科研论文成果选编(第2卷)[C];2010年
2 吕启春;;浅谈小学数学中的小组合作学习[A];2014年1月现代教育教学探索学术交流会论文集[C];2014年
3 杜俊娟;;用学习动机培养策略课题的学习对体育教师进行研究性学习培养的实验研究[A];第七届全国体育科学大会论文摘要汇编(一)[C];2004年
4 瞿春波;;浅议合作学习之误区[A];校园文学编辑部写作教学年会论文集[C];2007年
5 时龙;;把握分析学情是改进教学和促进学习的基础[A];2012·学术前沿论丛——科学发展:深化改革与改善民生(下)[C];2012年
6 韦彩红;;如何组织学生共享学习成果[A];中华教育理论与实践科研论文成果选编(第2卷)[C];2010年
7 格保耿;;培养学生学习物理的兴趣[A];2014年5月现代教育教学探索学术交流会论文集[C];2014年
8 钮荣荣;;关于小学数学教学中小组合作学习的几点思考[A];2014年6月现代教育教学探索学术交流会论文集[C];2014年
9 陈妙;;让数学课堂效率得到真正的提高——浅谈新课改下学生学习兴趣的培养[A];中华教育理论与实践科研论文成果选编(第3卷)[C];2010年
10 黄春妙;;浅谈语文课堂合作学习的有效把握[A];中华教育理论与实践科研论文成果选编(第3卷)[C];2010年
中国重要报纸全文数据库 前10条
1 农行浙江东阳支行 吴新国 周龙飞;银行如何创建学习型组织[N];上海金融报;2003年
2 西北师范大学 李瑾瑜;校长:如何引领和促进教师学习[N];中国教育报;2008年
3 永寿县店头中学 刘俊锋;大力提倡合作学习 全面促进有效教学[N];咸阳日报;2009年
4 本报评论员;要在真学习上下功夫[N];酒泉日报;2009年
5 本报记者 李天然;学习应该是一种终身行为[N];大连日报;2010年
6 刘继芳;浅议建设学习型党组织中的“学习”内涵[N];伊犁日报(汉);2010年
7 哈尔滨市第五医院 蒙硕;浅谈医院创建学习型党组织[N];黑龙江日报;2010年
8 翟爱霞;浅谈如何深入推进学习型党组织建设[N];太行日报;2011年
9 李振 上海交通大学国际与公共事务学院;制度变迁中的制度学习[N];中国社会科学报;2012年
10 重庆市教育评估院院长、中国高等教育学会学习科学研究分会常务副会长 龚春燕;实施新学习,建设学习型社会[N];中国教育报;2013年
中国博士学位论文全文数据库 前10条
1 徐峰;基于社会网络的大学生学习网络结构研究[D];江西财经大学;2014年
2 付亦宁;本科生深层学习过程及其教学策略研究[D];苏州大学;2014年
3 冯子勇;基于深度学习的图像特征学习和分类方法的研究及应用[D];华南理工大学;2016年
4 王星;关系分类模型的学习界限与应用[D];哈尔滨工业大学;2015年
5 潘剑寒;基于多潜在空间的迁移学习算法研究[D];合肥工业大学;2016年
6 杨春;反馈类型对大学生学习成绩的影响:自我调节学习的中介作用[D];东北师范大学;2016年
7 王浩宇;资源整合、创业学习与新创企业创新的关系研究[D];吉林大学;2017年
8 田青;有序学习及在图像分析中的应用研究[D];南京航空航天大学;2016年
9 邹朋成;有监督的相似性度量学习研究与应用[D];南京航空航天大学;2016年
10 马相春;基于大数据的初中数学智慧学习系统模型研究[D];东北师范大学;2017年
中国硕士学位论文全文数据库 前10条
1 王以宣;感知教师支持、基本心理需要满足与初中学生英语学习倦怠的关系[D];上海师范大学;2015年
2 李荣敬;不同情绪状态对学习判断的影响[D];河北师范大学;2015年
3 李兰翠;M00C学习平台的应用研究[D];上海师范大学;2015年
4 孙航;农民工随迁子女学习生态研究[D];上海师范大学;2015年
5 左扬扬;碎片化时代下企业微课程设计与应用[D];上海师范大学;2015年
6 戚政霞;基于翻转课堂的小学语文教学设计研究[D];上海师范大学;2015年
7 苏治芳;小学中高年级“微课题式”语文学习的实践研究[D];上海师范大学;2015年
8 张华;提高中职生语文课堂学习动力的策略研究[D];上海师范大学;2015年
9 强敏;“学困生”的现状调查与教育转化途径研究[D];宁夏师范学院;2015年
10 谢平;对初中学困生学习素质提高的情感教育研究[D];河北大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026