收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

迁移学习方法研究及其在跨领域数据分类中的应用

覃姜维  
【摘要】:信息技术的快速发展使人们可以获得的信息越来越多,如何有效地从信息中获取知识变得越来越重要。作为数据挖掘、知识发现的重要手段之一,机器学习受到了广泛的研究。但是随着实际应用的不断加强,机器学习方法的性能遇到了瓶颈,其中一个很重要的原因是许多学习方法有着的严格使用前提,即训练数据与测试数据必须满足同分布的假设。由此带来了很多问题,如训练数据过期、训练模型过期、标记训练样本成本过高等问题,大大降低了数据分析的效率。现实中训练数据和测试数据分布存在偏差的情况常会出现,但这个问题在研究上却常被忽略。 迁移学习方法放松了对训练数据和测试数据同分布假设的要求,能够利用不同领域的数据来帮助目标任务的学习,有效解决了训练数据和测试数据分布不一致的学习问题。目前,迁移学习受到了很多关注,同时也取得了丰富的成果。但是,通过总结和分析现有的方法发现,还存在如何在目标领域无标记数据情况下进行实例迁移、如何避免领域间分布参数估计的困难、如何控制领域差异较大的迁移过程中出现的负迁移以及如何平衡迁移算法的推广性和适应性等问题。 针对这些问题,本文以如何利用相似领域中的数据信息为出发点,以提高目标领域数据分类任务的精度为目标,以实例迁移和特征迁移为基本手段,在对已有方法的总结和分析基础上,对如何构造迁移环境和对如何建立迁移环境下的分类模型进行了研究,主要工作有以下几点: 1、提出了一种基于动态数据集的多步桥接精化迁移方法(MSBR)。通过多个由源数据分布向目标数据分布动态变化的混合数据集构建迁移环境,建立起源领域与目标领域的桥梁,将原始迁移任务分解成为若干个容易解决的迁移子任务,有效实现了判别信息的迁移,解决了目标领域无标记数据情况下对源数据进行重用的问题。 2、针对目标领域数据不足难以进行分布参数估计的情况,提出了一种基于嵌入修正的迁移学习方法(RETR),利用目标数据中的少量标记数据结合大量的未标记数据对源数据进行选择。在目标领域标记数据较少的情况下,结合未标记数据构建基础嵌入空间,在其中对源数据进行投射和筛选,并设计交替优化利用胜出的源数据对基础嵌入空间进行修正,实现源数据判别信息对目标数据划分结构的影响。 3、从特征空间出发,研究数据中隐含的内在结构之间的联系,提出了一种基于特征对齐的迁移方法(FATL)。通过求约束条件下的公共映射空间实现了源数据和目标数据的在特征空间的对齐,消除了领域间数据的分布差异,满足了传统分类器对训练数据和测试数据分布一致的要求,最终使问题回归到标准机器学习的问题当中。 4、提出实例迁移和特征迁移统一优化的思想。考虑到实例迁移方法主要根据目标领域的特性进行优化,因而具有较好的适应性,而特征迁移主要考虑领域间的共性,因而具有较好的推广性。为了提高迁移算法的实用性,考虑了领域间数据的多样性和联系性,提出了一种基于样例约束和特征联系的迁移(TICFR)方法,通过将迁移问题中的实例层信息和特征层信息转换成为相应的约束条件,引入新的优化方式将两者有机地结合起来。实验对比发现,基于样例约束和特征联系的迁移方法在迁移过程中取得推广性和适应性的平衡。 5、针对许多迁移问题当中可能会出现负迁移的情况,研究了对领域相似性的定量度量,将迁移风险引入学习过程中,结合TICFR,提出了控制负迁移的手段。通过将其应用到领域间数据差异较大的跨领域学习问题中发现,基于风险控制的迁移学习方法能够避免负迁移的发生,控制迁移过程中源数据对目标数据的不利影响。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈浩;;多媒体教学对学生学习过程的影响[J];南昌教育学院学报;2011年03期
2 曹化工,秦友淑;CIMS中的工程信息管理[J];华中理工大学学报;1994年06期
3 李斌;目标数据库管理系统的推广和应用[J];管理科学文摘;1996年10期
4 钱润生,陈云秋;舰载多传感器信息融合技术初探[J];舰船电子工程;2001年05期
5 秦友淑,曹化工;工程信息中目标数据的结构管理[J];华中理工大学学报;1994年02期
6 何芳;;远程教育中自主学习的过程探究[J];现代远程教育研究;2006年01期
7 胡艳艳;蔡建立;;基于引入学习过程的遗传算法的PID参数整定[J];五邑大学学报(自然科学版);2006年03期
8 陈瑞芳;;注重对学生学习过程的评价[J];现代教学;2008年11期
9 蒋美芳;;在“美的课堂”中让学生享受学习过程[J];现代教学;2011年05期
10 西广成;;神经网络系统学习过程初探[J];自动化学报;1991年03期
11 郭芯库;;现代远程开放教育注重学生学习过程质量保证的研究[J];湖北省社会主义学院学报;2006年05期
12 陈明建,胡上序;神经网络学习算法中的参数估值[J];计算机工程与设计;1992年06期
13 张越培,张岚;浅议网络环境对学生学习过程的影响[J];河南职工医学院学报;2001年04期
14 陈汉闺;;多媒体技术与学习过程的优化[J];邢台职业技术学院学报;2006年01期
15 贺鹏,瞿兆慧;用于实现CSTB MCAI学习过程智能化的数据库设计[J];微型电脑应用;2001年01期
16 张平松;吴荣新;侯辉;;大学生计算机学习和利用的定位与思考[J];黑龙江教育(高教研究与评估);2006年09期
17 林沛;;优化开放教育学习模式的客观描述[J];广东广播电视大学学报;2006年04期
18 王渊;怀自国;刘清华;郭斌;尹红;黄明和;;基于Web的在线学习系统的研究与设计[J];科技资讯;2010年12期
19 周永权;赵斌;;泛函网络模型及应用研究综述[J];电子科技大学学报;2010年06期
20 黄山涯;;从AECT“教学技术”定义看多媒体教学评价体系的构建[J];福建电脑;2010年11期
中国重要会议论文全文数据库 前10条
1 苏凯敏;韩关德;;中学生学习过程中的心理疲劳现象分析与疏导[A];中国心理卫生协会青少年心理卫生专业委员会第八届全国学术会议论文集[C];2002年
2 郭云飞;赵宏;薛安克;;海面声探测多目标数据预处理算法[A];浙江省信号处理学会2011学术年会论文集[C];2011年
3 秦启康;奚仲廉;;“开潜教育”的心理学研究[A];中国民办教育家优秀论文集[C];2006年
4 陈绍清;;复习课中深入学生学习过程,提高学习结果[A];国家教师科研基金“十一五”成果集(中国名校卷)(五)[C];2009年
5 杨丽霞;;重视学生学习物理的过程[A];国家教师科研基金“十一五”成果集(中国名校卷)(五)[C];2009年
6 孟宪宏;;VTS雷达数据通信系统RDC86的系统分析[A];船舶通信与导航(1995)[C];1995年
7 李权康;陈义明;;“活性评价”在学生学习过程中的应用[A];国家教师科研基金“十一五”成果集(中国名校卷)(三)[C];2009年
8 黄水琴;吴晓敏;;小学语文课堂三个“不等式”[A];江苏省教育学会2005年小学语文优秀论文集[C];2005年
9 哈尔滨市继红小学课题组;;构建“综合实践学习教学模式” 努力提高学生的综合素质课题研究报告[A];走进新教育:黑龙江省教育学会“十五”教育科学研究规划项目成果集[C];2006年
10 陈绍清;;复习课中深入学生学习过程,提高学习结果[A];国家教师科研基金十一五阶段性成果集(四川卷)[C];2010年
中国博士学位论文全文数据库 前10条
1 覃姜维;迁移学习方法研究及其在跨领域数据分类中的应用[D];华南理工大学;2011年
2 周琰;大学生认识信念研究[D];南京师范大学;2011年
3 李娟;促进教师观察了解儿童学习与发展水平的研究[D];华东师范大学;2011年
4 陈坤;在线核学习建模算法及应用研究[D];浙江大学;2011年
5 陈德品;基于迁移学习的跨领域排序学习算法研究[D];中国科学技术大学;2010年
6 刘艳;期望价值、学习目地和学习行为:汉语作为第二语言学习动机研究[D];南京大学;2012年
7 杜伟宇;复杂陈述性知识学习的研究[D];华东师范大学;2005年
8 王广斌;基于流形学习的旋转机械故障诊断方法研究[D];中南大学;2010年
9 吴本连;自主学习方式影响大学生体育学习效果的实验研究[D];华东师范大学;2010年
10 杨志强;开放式创新模式研究[D];南开大学;2009年
中国硕士学位论文全文数据库 前10条
1 杜俊卫;基于聚类的文本迁移学习算法研究及应用[D];山西财经大学;2011年
2 刘彩姣;论学习的实践属性[D];华中师范大学;2011年
3 奚莹;欧洲先前学习认证研究[D];兰州大学;2012年
4 孙春霞;测验对小学生学习的促进作用的实验研究及启示[D];山东师范大学;2012年
5 程虹;“基于脑的学习”研究性课程的开发与实践[D];华东师范大学;2011年
6 符浩;研究生学习倦怠与专业承诺关系及影响因素研究[D];西北大学;2010年
7 刘自红;基于知识管理的高阶学习过程设计研究[D];东北师范大学;2011年
8 曲静;中职生学习倦怠现状及教育对策研究[D];鲁东大学;2012年
9 高佳禾;由基于任务的学习看小学数学课堂教学的变革[D];上海师范大学;2010年
10 王生芳;陈云的学习观探析[D];河南大学;2011年
中国重要报纸全文数据库 前10条
1 通讯员 黄慧文;吉隆全体党员开展“比学促学”活动[N];日喀则报;2008年
2 冀灵渊 朔城区四中;为学生创设快乐的学习情境[N];朔州日报;2010年
3 民乐县逸夫小学 宋晓华;用爱心培养学生主动学习的兴趣[N];张掖日报;2005年
4 山东省临沭县白旄中学 张秀伟;如何培养中学生学习历史的习惯[N];学知报;2011年
5 本报记者 靳晓燕;哦,学习是能倒着来的[N];光明日报;2011年
6 郭佳 编译;21世纪的学习什么样[N];中国教师报;2011年
7 李林 余承武;努力把基层学习抓实抓深[N];战士报;2011年
8 姜堰市东桥中心小学 杨爱军;在课文课堂中渗透心理教育[N];成才导报.教育周刊;2005年
9 师炜;西安学习经验可全省推广[N];西安日报;2003年
10 剑河民族中学 刘明;刍议性格与学习的关系[N];贵州民族报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978