收藏本站
《华南理工大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

多标签分类问题的图结构描述及若干学习算法的研究

陈自洁  
【摘要】:多标签学习问题广泛存在于文本分类、图像标注、信息检索、基因功能分析、医学诊断、定向营销以及电子商务中的个性化推荐等很多现实的应用中,近年来得到了大量的关注和研究。多标签学习假设一个样本可被同时标注多个标签,且不同标签之间是相互依赖的,其与传统有监督学习的主要区别在于输出空间上。多标签分类问题的主要研究集中在多标签分类方法、标签结构学习、大规模标签问题、弱标签问题以及与其他学习问题的结合等方面。论文重点探讨多标签分类问题和分类方法的形式化描述、挖掘标签关联和处理大规模标签问题的多标签分类方法。(1)针对多标签分类问题和分类方法缺少形式化描述的问题,论文第三章重点为多标签分类问题的标签空间建立图结构,并对典型的多标签分类方法进行图结构描述。论文首先基于有限布尔代数和图论在标签空间上分别建立有限偏序集的哈斯图以及超立方体,以更好地反映多标签分类问题的结构化输出的特点。并证明标签空间的哈斯图和超立方体是同构的,具有一些好的性质。然后,在标签空间的超立方体结构上,对典型的多标签分类方法进行图结构描述,从而在统一的图结构中直观地表示多标签分类方法的特点及联系。(2)在多标签分类方法的图结构描述框架下,论文提出处理多标签隐含关联和大规模标签问题的若干学习算法。①针对挖掘数据隐含关联和数据降维在多标签学习中的重要性,论文第四章探讨两个基于典型相关分析(CCA)的多标签分类算法。第一个算法ML-CCA利用CCA来挖掘样本集与标签集之间的相关性并提取样本特征;第二个算法CCA_LSDR针对大规模标签问题,通过修改CCA的优化问题,要求标签向量的映射是正交的并且使得标签解码是低损的,从而获得结合样本信息的标签降维,并在预测阶段通过正交映射解码还原预测的标签集。在6个大规模标签数据集上的数值实验表明:ML-CCA和CCA_LSDR通过挖掘样本集与标签集的相关性能够保证学习性能;且与ML-CCA相比,CCA_LSDR通过标签降维能够实现更快的预测;另外,CCA_LSDR与其他标签空间降维方法相比,具有更快的训练速度。②针对挖掘标签关联的低维嵌入方法缺少综合考虑样本特征信息和分类误差的问题,论文第五章提出基于有监督低维嵌入的联合学习框架ML-SLDE/DML-SLDE,将挖掘隐含数据关联与最小化经验风险整合到一个联合框架中,平衡数据关联学习与分类误差在分类模型中的重要性。有监督低维嵌入建立在潜在语义分析的思想之上,能够结合样本特征信息和标签信息挖掘数据的隐含语义与关联,并提取有价值的低维特征建立多标签分类模型。而分类函数的系数由所得到的低维映射直接确定。为了验证ML-SLDE/DML-SLDE的性能,对10个典型多标签数据集进行对比实验,探讨算法在分类精度、训练复杂度以及对关键参数的敏感性等方面的表现。实验结果表明,ML-SLDE/DML-SLDE能够较好处理各种不同类型的多标签数据集,相对于其他五种算法,它在多个评价指标上都取得最好或第二好的结果;同时,ML-SLDE/DML-SLDE在大部分数据集上的训练时间具有明显的优势。另外,通过敏感性分析发现,ML-SLDE/DML-SLDE对于低维子空间的维度是鲁棒的。③针对现实应用数据的增量获取方式,论文第六章讨论第五章联合框架ML-SLDE/DML-SLDE的增量学习方案,在尽量利用历史计算信息的前提下,减少增量建模的时间花费。首先直接在原算法上进行简单的增量变形,提出ML-SLDE_I和DML-SLDE_I,并在7个不同规模的数据集上验证了ML-SLDE_I在很好地保持分类性能的同时,训练速度能够比不使用增量学习时快几倍,且随着旧样本地不断积累,使用ML-SLDE_I进行样本增量学习的优势会更突出。另外,针对简单增量变形存在的问题,提出基于增量SVD的样本增量学习方案ML-SLDE_SVDI。该方案建立在对联合框架的原形式ML-SLDE提出基于SVD分解的求解算法的基础上,避免了样本增量学习过程中需要在原形式和对偶形式间转换的问题。通过时间复杂度分析,预计该方案在高维低秩情况下能够更好地发挥增量学习的优势。实验结果表明,通过SVD分解对联合框架ML-SLDE进行求解和增量学习能够很好地保持学习精度,并且能比非SVD分解的算法具有更快的训练速度。
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41;TP181

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 盛集明;;n维立方体的性质[J];荆楚理工学院学报;2009年09期
【共引文献】
中国期刊全文数据库 前5条
1 盛集明;沈艳军;;N维超立方体的Merrifield-Simmons指标[J];兰州理工大学学报;2015年05期
2 盛集明;李学银;;有限集的幂集的Hasse图[J];荆楚理工学院学报;2011年09期
3 盛集明;李学银;;N维超立方体网络的网络特性[J];荆楚理工学院学报;2013年02期
4 程芳;叶永升;高洁;史彩霞;;超方体Q_n的路分解及其算法[J];计算机工程与应用;2015年06期
5 檀何凤;刘政怡;;基于标签相关性的K近邻多标签分类方法[J];计算机应用;2015年10期
中国博士学位论文全文数据库 前2条
1 刘茜;彩色人脸图像特征提取方法研究[D];南京邮电大学;2015年
2 王犁野;MRI图像分析中的稀疏特征学习方法研究[D];北京理工大学;2015年
中国硕士学位论文全文数据库 前1条
1 戚啸虎;关于图的P_3和P_4分解[D];淮北师范大学;2015年
【相似文献】
中国期刊全文数据库 前10条
1 张斌;张引;高克宁;郭朋伟;孙达明;;融合关系与内容分析的社会标签推荐[J];软件学报;2012年03期
2 顾亦然;陈敏;;一种三部图网络中标签时间加权的推荐方法[J];计算机科学;2012年08期
3 赵亚楠;董晶;董佳梁;;基于社会化标注的博客标签推荐方法[J];计算机工程与设计;2012年12期
4 靳延安;;一种基于动机倾向的标签推荐方法[J];计算机应用研究;2013年01期
5 崔超然;马军;;一种结合相关性和多样性的图像标签推荐方法[J];计算机学报;2013年03期
6 赵艳;王亚民;刘怀亮;;基于标签网络聚类的个性化资源推荐模型研究[J];情报杂志;2014年04期
7 陈毅波;揭志忠;吴产乐;;基于同义标签分组的协同推荐[J];湖南大学学报(自然科学版);2011年05期
8 张大鹏;闻佳;刘曦;;一种基于模型共享的半监督多标签图像学习法[J];系统仿真学报;2012年09期
9 张新伦;苏一丹;覃希;;标签模糊和冗余在标签推荐中的研究及应用[J];计算机应用研究;2011年08期
10 周朴雄;陈涛;;虚拟社区中基于相似标签聚类的语义信息推荐[J];情报理论与实践;2013年10期
中国重要会议论文全文数据库 前6条
1 朱广飞;董超;王衡;汪国平;;照片标签的智能化管理[A];第四届和谐人机环境联合学术会议论文集[C];2008年
2 房冠南;袁彩霞;王小捷;李江;宋占江;;面向对话语料的标签推荐[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 梅放;林鸿飞;;基于社会化标签的移动音乐检索[A];第五届全国信息检索学术会议论文集[C];2009年
4 李静;林鸿飞;;基于用户情感标签的音乐检索算法[A];第六届全国信息检索学术会议论文集[C];2010年
5 骆雄武;万小军;杨建武;吴於茜;;基于后缀树的Web检索结果聚类标签生成方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 王波;唐常杰;段磊;尹佳;左劼;李川;;RT-Rank:基于RSS标签排名相关性的文档聚类[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
中国重要报纸全文数据库 前2条
1 李梅;保护RFID信息[N];计算机世界;2004年
2 编译 金国斌;RFID离商业化目标还有多远[N];中国包装报;2006年
中国硕士学位论文全文数据库 前10条
1 胡蓉;基于标签—主题模型的标签推荐研究[D];华中师范大学;2013年
2 高兵;问答式社区的标签推荐技术研究[D];哈尔滨工业大学;2009年
3 葛艳艳;基于社会标签系统的推荐技术研究[D];大连理工大学;2011年
4 万元元;社会性标签系统的个性化资源推荐[D];天津大学;2012年
5 房冠南;面向对话语料的标签推荐[D];北京邮电大学;2012年
6 张恒婷;社交网络图像垃圾标签去除研究[D];华北电力大学;2012年
7 田健;面向特定分类体系的标签推荐算法研究[D];东北大学;2012年
8 张新伦;社会化标签推荐系统中标签模糊和冗余的研究[D];广西大学;2011年
9 王庚;社会网络中基于标签传播的重叠社区挖掘研究[D];山东建筑大学;2013年
10 孔祥迎;基于社会化标签的个性化推荐技术研究[D];电子科技大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026