收藏本站
《中国矿业大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

基于知识表达的迁移学习研究

张倩  
【摘要】:随着计算机信息技术的飞速发展,从海量数据中挖掘有用的信息并加以利用已经成为当前的研究热点。在数据挖掘中,传统的机器学习假设训练数据与测试数据具有相同的分布,而实际应用中往往并不能满足这一假设,即使勉强满足也大大降低了数据分析的效率。迁移学习方法能够有效地在相似的领域或任务之间进行信息的共享和迁移,使传统的从零开始的学习变成可积累的学习,具有成本低,效率高等优点,近几年成为数据挖掘和机器学习的关注焦点。 迁移学习最大的特点就是利用相关领域的知识来帮助完成目标领域中的学习任务。但是,不同的知识表达方式直接影响迁移学习的效果。本文从知识的表达方式入手,对知识表达与迁移方法的结合方式展开研究,主要工作如下: 首先,针对源领域数据和目标领域数据分布类似的情况,提出一种基于多源动态TrAdaBoost的实例迁移学习方法。该方法考虑多个源领域知识,使得目标任务的学习可以充分利用所有源领域信息;每次训练候选分类器时,所有源领域样本都参与学习,可以获得有利于目标任务学习的有用信息,从而避免负迁移的产生。理论分析验证了所提算法较单源迁移的优势,以及加入动态因子改善了源权重收敛导致的权重熵由源样本转移到目标样本的问题。实验结果表明,此算法在提高识别率和分类精度等方面的优势。 其次,针对源领域数据和目标领域数据分布差别较大的情况,提出一种基于协方差矩阵的特征迁移学习方法。该方法采用相似学习估计个体参数的协方差对,从数据间特征联系出发,通过构造半正定规划来组合这些估计值并学习当前任务的先验值,构建多变量高斯先验的协方差矩阵,进而对未标记的数据进行有效预测。实验结果表明,所提方法利用少量的源任务即可得到较好的迁移学习结果。 再次,针对共享知识是一些基函数的参数模型或先验分布的情况,提出一种基于层次贝叶斯的参数迁移学习方法。该方法定义任务相关性的层次概念,对标准Dirichlet过程模型进行扩展,建立多任务环境下的贝叶斯强化学习模型;有效学习类别数量、类型的推断过程以及用于探索新任务时的类别结构,从而更快地学习更多的知识。实验结果表明,提出的方法可以加快新领域中最优策略的收敛速度。 最后,针对共享知识是规则、结构和逻辑等关联规则的情况,提出一种基于马尔可夫逻辑网的关联规则迁移学习方法。该方法首先利用伪对数似然函数,将源领域中马尔可夫逻辑网表示的知识迁移到目标领域中,建立两个领域之间的关联;通过对源领域进行自诊断、结构更新和目标领域搜索新子句,来优化映射得到的结构,进而适应目标领域的学习。实验结果表明,算法成功地映射了迁移知识,提高了学习模型的精确度。 全文针对目前迁移学习研究中存在的部分问题,以如何利用源领域和目标领域间共享的不同知识表达方式为出发点,以提高目标领域的学习效率为目的,以不同的迁移方法为基本手段,对如何构造迁移环境和如何建立迁移环境下的有效迁移模型进行深入研究,提出了解决办法。实验结果验证了上述方法的可行性和有效性。论文研究成果丰富了迁移学习理论,为其在数据挖掘中的应用提供了有益的指导。
【学位授予单位】:中国矿业大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP181

【参考文献】
中国期刊全文数据库 前10条
1 王皓;高阳;陈兴国;;强化学习中的迁移:方法和进展[J];电子学报;2008年S1期
2 王雪松;潘杰;程玉虎;;基于知识迁移的Ant-Q算法[J];电子学报;2011年10期
3 朱慧明,韩玉启;基于正态—逆Wishart先验分布的贝叶斯分类识别方法研究[J];工程数学学报;2004年01期
4 刘志刚,李德仁,秦前清,史文中;支持向量机在多类分类问题中的推广[J];计算机工程与应用;2004年07期
5 熊忠阳;舒方俊;张玉芳;孔润;;Markov逻辑网在迁移学习中的应用[J];计算机工程;2011年24期
6 朱志勇,刘伟铭,伍友龙;基于Bayes法则和BP神经网络的高速动态情形下车型识别[J];计算机测量与控制;2005年07期
7 王雪松;潘杰;程玉虎;;基于图知识迁移的蚁群算法参数选择[J];控制与决策;2011年12期
8 张倩;李明;王雪松;;基于密度分布的半监督回归算法研究[J];工矿自动化;2012年03期
9 朱美强;程玉虎;李明;王雪松;冯涣婷;;一类基于谱方法的强化学习混合迁移算法[J];自动化学报;2012年11期
10 徐从富;郝春亮;苏保君;楼俊杰;;马尔可夫逻辑网络研究[J];软件学报;2011年08期
中国博士学位论文全文数据库 前9条
1 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
2 覃姜维;迁移学习方法研究及其在跨领域数据分类中的应用[D];华南理工大学;2011年
3 蔡伟宏;基于非参数贝叶斯方法的资产配置[D];华中科技大学;2012年
4 王利民;贝叶斯学习理论中若干问题的研究[D];吉林大学;2005年
5 孙舒杨;统计关系学习的若干问题研究[D];吉林大学;2006年
6 宫秀军;贝叶斯学习理论及其应用研究[D];中国科学院研究生院(计算技术研究所);2002年
7 刘赫;文本分类中若干问题研究[D];吉林大学;2009年
8 柴晶;雷达高分辨距离像目标识别的拒判算法和特征提取技术研究[D];西安电子科技大学;2010年
9 陈德品;基于迁移学习的跨领域排序学习算法研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前9条
1 杜俊卫;基于聚类的文本迁移学习算法研究及应用[D];山西财经大学;2011年
2 孔润;马尔可夫逻辑网在超文本分类与链接预测中的应用[D];重庆大学;2011年
3 王晓园;贝叶斯方法在保险精算中的应用研究[D];重庆理工大学;2011年
4 张杰;基于协方差矩阵的稳健目标匹配算法研究[D];燕山大学;2012年
5 任周鹏;三峡库区蓄水前后鼠密度空间分布统计推断[D];东北师范大学;2011年
6 陈东;基于层次贝叶斯的子空间分类[D];浙江大学;2008年
7 黄涛;马尔可夫逻辑网在Web中的应用[D];重庆大学;2010年
8 孙琦;基于协方差矩阵的目标跟踪方法[D];黑龙江大学;2012年
9 许至杰;迁移学习理论与算法研究[D];华东师范大学;2012年
【共引文献】
中国期刊全文数据库 前10条
1 李凡群;;熵损失下Pareto分布参数估计[J];安徽电子信息职业技术学院学报;2006年01期
2 李正龙;风险决策中不同决策准则决策一致性条件[J];安徽大学学报(自然科学版);2005年04期
3 潘希姣;;多子群粒子群集成神经网络[J];安徽建筑工业学院学报(自然科学版);2007年02期
4 李大林;陈一帆;蔡润;;多性状群体信息熵混杂递增链与混杂指数的应用[J];安徽农业科学;2008年13期
5 张涛;;提高离散数学课程学习兴趣的教学改革探讨[J];安徽工业大学学报(社会科学版);2012年01期
6 康会光;刘杏梨;;随机截尾寿命试验两参数Pareto分布的Bayes统计分析[J];安阳师范学院学报;2008年02期
7 林正奎;唐焕玲;鲁明羽;王敬东;;基于特征多视图提升Naive Bayesian的Boosting改进算法[J];北京交通大学学报;2009年06期
8 张海;王尧;陈冰;胡荣祖;高红旭;赵凤起;;用Boosting算法预测多硝基芳香族化合物的密度[J];火炸药学报;2007年05期
9 张海;丁毅涛;王尧;胡荣祖;高红旭;赵凤起;;自适应梯度Boosting算法及多硝基芳香族化合物密度的主因子选择[J];火炸药学报;2011年02期
10 周昊;赵修平;吴文军;罗木生;;某型导弹发射装置故障检测率的Bayes估计[J];兵工自动化;2009年12期
中国重要会议论文全文数据库 前10条
1 张晓艳;唐吴;韩江洪;周雷;;多Agent系统连续时间Option算法[A];第二十九届中国控制会议论文集[C];2010年
2 ;Predictive Control Based on Multi-network for a Deep Seabed Mining Robot Vehicle[A];中国自动化学会控制理论专业委员会A卷[C];2011年
3 朱琳;;声纳系统设计与调试中图论方法研究[A];2011'中国西部声学学术交流会论文集[C];2011年
4 武进;尹恺;王长明;张家才;;SVDM在蔬菜病害图像分类中的应用[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
5 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
6 林震;程永生;姜同敏;胡斌;;成败型产品可靠性鉴定试验探讨[A];第十一届全国可靠性物理学术讨论会论文集[C];2005年
7 刘斐;汪彤;吕良海;白光;;城市燃气管线火灾事故的风险定量分析[A];“中国视角的风险分析和危机反应”——中国灾害防御协会风险分析专业委员会第四届年会论文集[C];2010年
8 孙兆豪;李昂;刘坤起;解建军;;论代数、逻辑和智能系统之间的对应关系[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
9 陈峰;桂卫华;王随平;韩晓英;;深海底履带机器车的多神经网络预测控制[A];第二十三届中国控制会议论文集(下册)[C];2004年
10 李晶;陈媛媛;;基于AdaBoost的车牌字符识别模型研究[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅰ)[C];2008年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
3 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
4 卢建平;基于拓扑学和统计学的无字库汉字智能造字研究[D];华南理工大学;2010年
5 丁轶群;基于概率生成模型的文本主题建模及其应用[D];浙江大学;2010年
6 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
7 杨国鹏;基于机器学习方法的高光谱影像分类研究[D];解放军信息工程大学;2010年
8 徐迪红;复杂背景下的交通标志检测和分类算法研究[D];武汉大学;2010年
9 顾全;基于集成智能的膜蛋白受体结构与功能研究[D];东华大学;2010年
10 李军;不平衡数据学习的研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 马冉冉;集成学习算法研究[D];山东科技大学;2010年
3 王萍;语音情感识别研究[D];山东科技大学;2010年
4 韦师;几种分布参数的E-Bayes估计及其应用[D];广西师范学院;2010年
5 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
6 王利明;一种基于PMIPv6的智能辅助高效切换方案[D];郑州大学;2010年
7 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
8 曹彦;基于支持向量机的特征选择及其集成方法的研究[D];郑州大学;2010年
9 周驰;数据流上概念漂移的检测和分类[D];郑州大学;2010年
10 邓禄群;高光谱图像类别信息相关技术研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 苏岩;贝叶斯统计的发展及其争鸣[J];保定师范专科学校学报;2003年02期
2 苏岩;;ParetoⅡ型分布的尾部特征及其参数估计[J];保定学院学报;2009年04期
3 潘家柱,丁美春;GP分布模型与股票收益率分析[J];北京大学学报(自然科学版);2000年03期
4 许昌林;魏立力;;一元线性回归模型的贝叶斯分析[J];重庆工学院学报(自然科学版);2009年03期
5 张兢;候旭东;吕和胜;;基于朴素贝叶斯和支持向量机的短信智能分析系统设计[J];重庆理工大学学报(自然科学版);2010年01期
6 王国才;张聪;;一种基于粗糙集的特征加权朴素贝叶斯分类器[J];重庆理工大学学报(自然科学版);2010年07期
7 吴永;邵明阳;;重尾索赔下常利力更新风险模型的破产概率[J];重庆理工大学学报(自然科学版);2010年10期
8 吴永;王晓园;;贝叶斯方法估计极端损失再保险纯保费[J];重庆理工大学学报(自然科学);2011年04期
9 黄真理;国内外大型水电工程生态环境监测与保护[J];长江流域资源与环境;2004年02期
10 张静,汪诚信,白呼群,苏崇鳌,鄂启顺,武桂珍,黄玉英;三峡库区虫媒和自然疫源性疾病分析[J];长江流域资源与环境;2004年02期
中国博士学位论文全文数据库 前10条
1 廖学军;基于高分辨距离像的雷达目标识别[D];西安电子科技大学;1999年
2 夏建涛;基于机器学习的高维多光谱数据分类[D];西北工业大学;2002年
3 邢孟道;基于实测数据的雷达成像方法研究[D];西安电子科技大学;2002年
4 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
5 苏卫东;金融波动模型及其在中国股市的应用[D];天津大学;2002年
6 孙舒杨;统计关系学习的若干问题研究[D];吉林大学;2006年
7 王雪松;宽带极化信息处理的研究[D];国防科学技术大学;1999年
8 石东昱;适合分布计算环境不确定性处理的概率图模型若干问题研究[D];上海交通大学;2006年
9 袁莉;基于高分辨距离像的雷达目标识别方法研究[D];西安电子科技大学;2007年
10 杜兰;雷达高分辨距离像目标识别方法研究[D];西安电子科技大学;2007年
中国硕士学位论文全文数据库 前9条
1 张银银;图像匹配技术的算法研究[D];华中科技大学;2010年
2 胡璟璟;复杂场景下目标跟踪的多模板匹配算法研究[D];国防科学技术大学;2010年
3 傅安里;证券投资基金的波动择时能力研究[D];湖南大学;2005年
4 余向华;蚊媒传染病流行特征及气象影响因素研究[D];浙江大学;2007年
5 蒋红;中文文本分类中文本表示及分类算法研究[D];浙江师范大学;2007年
6 刘起勇;全国病媒生物监测系统运行评估[D];中国疾病预防控制中心;2008年
7 戴文渊;基于实例和特征的迁移学习算法研究[D];上海交通大学;2009年
8 殷伶;图像匹配技术的研究[D];西安电子科技大学;2010年
9 卜凡艳;数字图像匹配技术研究[D];合肥工业大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 武建华;沈均毅;王元元;;一种改进的关联分类算法[J];计算机工程;2009年09期
2 朱晓燕;宋擒豹;;基于排序的关联分类算法[J];计算机科学;2009年07期
3 吕滨;;最优关联规则的形式和挖掘思想研究[J];中国科技信息;2006年04期
4 许孝元;韩国强;闵华清;;多步原子规则的大规模关联分类[J];控制理论与应用;2007年03期
5 程岩;;电子商务中基于Q学习的动态交叉销售方法[J];管理科学学报;2008年03期
6 吴斌;吴臣;;数据挖掘及其在远程教学中的应用[J];电脑知识与技术;2009年24期
7 陈火旺;张少平;;基于解释的学习[J];计算机科学;1990年01期
8 陈建国;;一种多层前馈网络的学习策略[J];乐山师范学院学报;2006年12期
9 黄树成;曲亚辉;;半监督学习在研究生调剂中的应用[J];计算机系统应用;2011年04期
10 苏宝莉;;一种信息系统中缺损数据处理的新方法[J];甘肃科技;2006年11期
中国重要会议论文全文数据库 前10条
1 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
2 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
3 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
4 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
8 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 周水庚;胡运发;陶晓鹏;;分布数据库关联规则的递增挖掘[A];第十五届全国数据库学术会议论文集[C];1998年
中国重要报纸全文数据库 前10条
1 刘晓波 崔天伦;任职培训是学习方法刍议[N];人民武警;2006年
2 于云东 任惠彬 华军 任中兴 陈平军 刘志刚 胡其宗 陈讲峰;学以致用 用以促学 学用相长[N];人民武警;2003年
3 朱爱林 张其云;紧密联系实际 创新学习方法[N];中国工商报;2010年
4 天予;教学方法需创新[N];中国妇女报;2002年
5 弓习科;丛台区理论学习方法多求实效[N];邯郸日报;2007年
6 张延宁;浅谈初中数学的学习方法[N];济宁日报;2008年
7 钟山;日读3500字是怎样落实的?[N];解放军报;2000年
8 广西中医学院 刘燕平广西右江民族医学院 黄岑汉;浅谈中医诊断学及其学习方法[N];中国中医药报;2007年
9 金彧;《数据库原理》学习方法谈[N];中国电脑教育报;2002年
10 李冬梅;教学方法的创新[N];山西日报;2002年
中国博士学位论文全文数据库 前10条
1 张倩;基于知识表达的迁移学习研究[D];中国矿业大学;2013年
2 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
3 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
4 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
5 伊卫国;基于关联规则与决策树的预测方法研究及其应用[D];大连海事大学;2012年
6 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年
7 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
8 楼巍;面向大数据的高维数据挖掘技术研究[D];上海大学;2013年
9 李学明;计算机数据的关联规则挖掘理论和算法研究[D];重庆大学;2003年
10 王春雨;刑事案件关联分析与防控警务模式研究[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
2 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年
3 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年
4 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年
5 聂倩雯;基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D];西南交通大学;2010年
6 吴倩;基于关联规则的零售业CRM的设计和实现[D];华东师范大学;2011年
7 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年
8 孙彤;活性炭纤维吸附和解吸中的数据挖掘技术[D];辽宁工程技术大学;2004年
9 王烁;关联规则数据挖掘中经典频集算法改进的研究[D];天津大学;2003年
10 王玉荣;关联规则挖掘算法在大数据集上的应用研究[D];江南大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026