收藏本站
《南京大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

利用未标记数据的机器学习方法研究

郭翔宇  
【摘要】:机器学习需要有标记数据来训练模型进行预测,有标记数据的获取通常需要人工参与,因此价格非常昂贵。在很多实际应用中,未标记数据可以较为容易地大量获取,如何利用廉价的未标记数据一直以来都是机器学习领域中的研究热点。目前出现了两种利用未标记数据的方法:一种是自动利用未标记数据辅助有标记数据提升学习性能的半监督学习;虽然该类方法大多能够提升学习性能,但都基于潜在的模型假设,当模型假设与数据分布存在偏差时可能会降低学习性能;另一种是通过众包以较低的代价给数据提供标记,进而可以精确利用未标记数据以降低学习风险。本文主要围绕半监督学习和众包进行研究,取得了以下进展:第一,针对半监督学习中的重要风范协同训练易受不充分视图的影响这一问题,提出了一种新型的加权协同训练算法。视图不充分时协同训练过程中会出现与最优分类器不一致的样本,该算法通过检测潜在的不一致样本并降低其权值以减少这些样本对训练过程的影响。实验结果表明,与标准的协同训练算法相比该算法有更好的泛化性能与更强的鲁棒性。第二,针对众包过程中任务标记依赖于任务难度这一特点,提出了一种新型的任务分配算法。该算法通过估计部分任务的难度构建训练集学得预测难度的模型,将任务分为简单和困难两类。对于简单的任务可利用众包进行标记;而对于困难的任务,则需雇佣专家为其提供高质量标记。实验结果表明该算法能够在提高标记质量的同时降低标记代价。此外,本文还对利用未标记数据的模型复用进行了研究,该场景中用户需要集成多个无法修改的预训练模型,针对这一问题,本文提出了一种新型的多视图模型复用算法。该算法通过信念传播估计预训练模型的可靠性,并基于未标记数据上的多视图一致性指导这一估计过程,进而利用估计得到的可靠性加权集成多个预训练模型。实验结果表明该方法能够显著提升分类精度。
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP181

手机知网App
【共引文献】
中国期刊全文数据库 前10条
1 朱小香;许金森;萨喆燕;万隆;黄倩茹;潘晓华;杨广印;;急性胃黏膜损伤大鼠背部敏化穴位的分布[J];山西中医学院学报;2017年03期
2 朱昕昀;金红娇;李香蕾;杨运宽;;杨运宽教授针药结合治疗焦虑症经验举隅[J];亚太传统医药;2017年12期
3 彭欣;;逍遥散加减联合针灸治疗中风后焦虑症疗效观察[J];亚太传统医药;2017年12期
4 田艳君;刘传新;刘海青;白波;;抑郁症全基因组关联分析的研究进展[J];中华诊断学电子杂志;2017年02期
5 王燕;袁文杰;刘红云;王海萍;;治脊疗法配合质子泵抑制剂(PPI)治疗胃食管反流病的效果分析[J];系统医学;2017年09期
6 莫阔;王秀珍;;护理干预对非糜烂性胃食管反流病患者临床症状及生命质量的作用[J];检验医学与临床;2017年08期
7 鲁海;白玮婧;马会靖;张苗;高士宜;刘浩敏;张春红;武连仲;;针刺配合康复训练治疗中风后不同类型共济失调下肢功能障碍临床观察[J];上海针灸杂志;2017年04期
8 付廷生;;胃食管反流病的中医内科治疗效果观察[J];人人健康;2017年08期
9 林智勇;;柴胡疏肝散加减配合耳穴按压治疗肝胃不和型胃食管反流病临床研究[J];亚太传统医药;2017年04期
10 孟斌;田靖;;“通督温阳”法针刺治疗肌萎缩侧索硬化症临床观察[J];上海针灸杂志;2017年02期
中国硕士学位论文全文数据库 前10条
1 赵倩倩;针刺督脉背段对改善胃食管反流病人反流症状和心理状态的研究[D];北京中医药大学;2017年
2 陈国宁;加味四逆散治疗非糜烂性反流病肝胃不和证的临床研究[D];山西中医学院;2016年
3 高璐佼;针刺督脉背段治疗胃食管反流病临床研究[D];北京中医药大学;2016年
4 孙雅玲;同精导气针法治疗过敏性鼻炎临床研究[D];广州中医药大学;2016年
5 曾维盈;赖氏通元法艾灸治疗心源性水肿的临床研究[D];广州中医药大学;2016年
6 栾坤;针刺对脑梗死大鼠海马区AIF和Endo G蛋白表达影响[D];南京中医药大学;2016年
7 向云霞;针灸治疗中风后吞咽障碍的系统评价[D];成都中医药大学;2015年
8 易长兴;针刺任督脉穴位结合中风单元治疗中风后吞咽困难的临床疗效观察[D];湖南中医药大学;2014年
9 于潇;针刺督脉经穴为主治疗心肾不交型失眠临床疗效观察[D];辽宁中医药大学;2014年
10 史蕊;基于ARM系统的脉冲电疗仪设计[D];吉林大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 年媛媛;王学勤;孟宪梅;张军;;体质量指数对胃食管反流病患者胃食管反流的影响[J];国际消化病杂志;2015年05期
2 曹建新;;整体医学模式下心身医学评估的临床实践[J];中华诊断学电子杂志;2015年02期
3 毛家亮;何奔;;综合医院非心理专科患者心理障碍早期识别及对策[J];中华诊断学电子杂志;2015年02期
4 朱宝宇;宋德锋;施春雨;冯野;;胃食管反流病发病机制研究进展[J];中国实验诊断学;2015年02期
5 原林;;妊娠期胃食管反流病研究进展[J];胃肠病学;2014年12期
6 高福生;于涛;刘宾;伍冀湘;李建业;;食管裂孔疝与胃食管反流病[J];中华胃食管反流病电子杂志;2014年01期
7 吴齐飞;吴继敏;白兴华;王志华;蔡惠玉;宫玮瓅;田书瑞;;胃食管反流病患者在督脉背段的压痛反应规律[J];中国针灸;2014年08期
8 胡乃华;张望刚;史红;陈国神;;石杉碱甲微乳型巴布剂经督脉给药对早老性痴呆患者的临床疗效[J];中国现代应用药学;2014年05期
9 皮敏;陈鹏典;杨卓欣;于海波;罗文舒;吴永刚;王玲;饶晓丹;马晓明;;电针督脉联合人脐血间充质干细胞移植对脑缺血大鼠神经功能缺损及细胞凋亡的影响[J];时珍国医国药;2014年02期
10 吴光勤;王雯;;胃内酸袋的研究进展及与胃食管反流病的关系[J];世界华人消化杂志;2013年36期
中国硕士学位论文全文数据库 前3条
1 宫玮(王乐);胃食管反流病之反酸的中医古籍文献研究[D];北京中医药大学;2013年
2 王丹;症状问卷Gerd Q对胃食管反流病的诊断[D];重庆医科大学;2011年
3 瞿国强;安徽省铜陵地区消化门诊胃食管反流病临床流行病学研究[D];安徽医科大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 罗进;周学君;;半监督学习中非标记数据的利用[J];湖北大学学报(自然科学版);2008年01期
2 郭涛;李贵洋;兰霞;;基于图的半监督协同训练算法[J];计算机工程;2012年13期
3 李艳娟;郭茂祖;;关系tri-training:利用无标记数据学习一阶规则[J];计算机科学与探索;2012年05期
4 李昆仑;曹铮;曹丽苹;张超;刘明;;半监督聚类的若干新进展[J];模式识别与人工智能;2009年05期
5 武永成;;无标记数据学习及其在图像检索中的应用[J];软件导刊;2013年03期
6 邓超;郭茂祖;;基于Tri-Training和数据剪辑的半监督聚类算法[J];软件学报;2008年03期
7 李昆仑;张伟;代运娜;;基于Tri-training的半监督SVM[J];计算机工程与应用;2009年22期
8 易淼;刘小兰;;基于相对变换的半监督分类算法[J];计算机应用;2011年10期
9 苏进胜;谢彦峰;张忠林;;基于事务的概率标记数据包的IP回溯[J];兰州交通大学学报;2006年04期
10 高云天;;基于不完全信息的半监督KMeans算法[J];中国新技术新产品;2009年03期
中国重要会议论文全文数据库 前1条
1 刘小平;黎夏;张啸虎;;一种新的基于多标记分解模型的遥感软分类方法[A];中国地理学会百年庆典学术论文摘要集[C];2009年
中国博士学位论文全文数据库 前1条
1 覃姜维;迁移学习方法研究及其在跨领域数据分类中的应用[D];华南理工大学;2011年
中国硕士学位论文全文数据库 前9条
1 唐俊;基于多示例多标记学习的手机游戏道具推荐[D];南京大学;2015年
2 郭翔宇;利用未标记数据的机器学习方法研究[D];南京大学;2017年
3 刘萌;基于特征的归纳式迁移学习方法研究[D];哈尔滨工程大学;2012年
4 卢小燕;基于半监督和局部降维的多标记数据分类[D];中南大学;2013年
5 郭跃健;多值属性和多标记数据分类[D];中南大学;2010年
6 张顺;多标记数据分类相关技术研究[D];山东师范大学;2013年
7 丁涛;半监督自训练分类模型的研究与实现[D];大连理工大学;2009年
8 付华;基于极限学习机的半监督分类[D];西安电子科技大学;2013年
9 张金辉;基于少量标记数据约束聚类算法的入侵检测技术研究[D];南京航空航天大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026