收藏本站
《浙江大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于图的半监督学习及其应用研究

潘俊  
【摘要】:机器学习的一项重要任务是对先验知识的表达和利用,除了类标记和成对约束等监督信息外,样本的空间结构也是先验知识的重要表现形式之一。近年来,得益于其对局部结构的刻画能力以及与经典方法(如正则化技术、核方法、谱图理论)的紧密联系,利用图来逼近数据间的局部流形的方法受到了研究者的大量关注。其中,基于图的半监督学习方法由于能同时利用部分有标记样本和大量无标记样本来提高学习性能,成为机器学习领域的研究热点之一。 本文在分析了基于图的半监督学习的发展现状和现存问题的基础上,从图的构造和图的优化两大方面入手,围绕半监督图学习在分类、聚类和降维等典型任务中的应用进行了研究。论文的主要研究工作和创新点如下: 1、提出了一个融合局部几何信息与全局判别信息的正则化框架。该框架具有一定的宽泛性,可通过选择不同的损失项和正则化项,推广到其他半监督分类算法的改进。作为该框架的一种具体实现,提出了局部敏感的判别直推学习方法,该方法在正则化框架中同时引入了有助于分类的样本局部结构信息和判别信息,从而最大程度地利用样本内蕴信息,能在每个局部邻域中进一步最大化类间样本的间隔。 2、提出了一种利用先验知识来同时指导数据降维和聚类的方法。该方法构造成对约束信息的k-最近邻集并扩充成对约束集,分析成对约束实例包含的信息量并构造权系数矩阵,在加权成对约束信息的指导下求得投影矩阵,通过投影矩阵将样本数据投影到低维空间,使类内各点紧密分布,类间各点分散分布。同时,该方法通过一种新的评价函数对k-均值聚类算法进行了改进,能够在尽量不违反成对约束的情况下优化聚类性能。 3、提出了一种基于结构和约束保持的半监督特征选择方法。针对特征排序选择算法在处理高维数据问题时存在的一些不足,通过引入以成对约束形式表现的监督信息,并借助流形学习的思想,提出一种能同时保持样本空间结构和监督信息的半监督特征选择方法。该方法同时考虑样本的局部和非局结构,融合成对约束信息,定义了一种新的特征评价准则——结构约束保持分(SCP Score)。结构约束保持分利用大量的未标记样本来学习样本空间的流形结构,利用少量的成对约束信息来学习样本的类内和类间边缘,所选择的特征子集较好地保持了空间结构信息和类属信息。 4、提出了一种基于图随机游走的直推学习模型。首先将以Agent表示的样本点随机映射到格网表示的输出空间中,构成初始空间格局,空间格局随时间演化的过程是一个自组织的马尔可夫过程,它将在有限时间内达到平稳分布,从而求得最佳的标记分布,并从数学上分析了算法的性质。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP181

知网文化
【引证文献】
中国期刊全文数据库 前1条
1 刘翠响;赵亚娜;王宝珠;张艳;;基于图论的人脸图像数据降维方法综述[J];电子设计工程;2013年16期
【参考文献】
中国期刊全文数据库 前9条
1 皋军;王士同;邓赵红;;基于全局和局部保持的半监督支持向量机[J];电子学报;2010年07期
2 罗四维;赵连伟;;基于谱图理论的流形学习算法[J];计算机研究与发展;2006年07期
3 毛勇;周晓波;夏铮;尹征;孙优贤;;特征选择算法研究综述[J];模式识别与人工智能;2007年02期
4 李昆仑;曹铮;曹丽苹;张超;刘明;;半监督聚类的若干新进展[J];模式识别与人工智能;2009年05期
5 蔡哲元;余建国;李先鹏;金震东;;基于核空间距离测度的特征选择[J];模式识别与人工智能;2010年02期
6 王玲;薄列峰;焦李成;;密度敏感的半监督谱聚类[J];软件学报;2007年10期
7 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
8 邓超;郭茂祖;;基于Tri-Training和数据剪辑的半监督聚类算法[J];软件学报;2008年03期
9 韦佳;彭宏;;基于局部与全局保持的半监督维数约减方法[J];软件学报;2008年11期
中国博士学位论文全文数据库 前1条
1 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 李广水;宋丁全;;数据分析在森林资源调查中的应用及发展研究[J];安徽农业科学;2009年22期
2 郇正军;赵国富;;基于土地利用的空间数据挖掘系统的设计与实现[J];安徽农业科学;2011年07期
3 刘利;韦佳;马千里;;基于流形学习的图像检索研究进展[J];北京交通大学学报;2010年05期
4 卢宏建;高永涛;吴顺川;潘贵豪;;石人沟铁矿露天转地下开采生产规模优化[J];北京科技大学学报;2008年09期
5 左国才;周荣华;符开耀;;基于DBSCAN算法的电信客户分类的应用研究[J];北京联合大学学报(自然科学版);2012年03期
6 李侃,刘玉树;Mercer Kernel Based Fuzzy Clustering Self-Adaptive Algorithm[J];Journal of Beijing Institute of Technology(English Edition);2004年04期
7 李晓方;武仲科;樊亚春;周明全;柳勇光;;一种新的用于三维检索的快速邻域搜索方法[J];北京师范大学学报(自然科学版);2011年05期
8 刘志勇;冯国灿;王珏;;局部线性嵌入及其在人脸表情识别中的应用[J];江西师范大学学报(自然科学版);2010年04期
9 章林柯;崔立林;;潜艇机械噪声源分类识别的小样本研究思想及相关算法评述[J];船舶力学;2011年08期
10 孙英娟;杨柳;何昆鸟;;属性离散化算法研究[J];长春师范学院学报(人文社会科学版);2009年12期
中国重要会议论文全文数据库 前10条
1 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
2 曾成;赵锡均;徐红;;基于量子遗传算法的聚类方法[A];第二十九届中国控制会议论文集[C];2010年
3 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
4 杨晓霞;朱庆;李海峰;;知识导航的遥感信息处理服务分类选择方法[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
5 傅向华;王志强;赵良辉;杜文峰;;基于拉普拉斯流形正则化的半监督图像检索[A];第四届和谐人机环境联合学术会议论文集[C];2008年
6 ;A Fuzzy Neural Network System Modeling Method Based on Data-driven[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
7 刘保政;汪定伟;;基于多因素的相近距离聚类方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
8 张立涛;张宇峰;;基于聚类分析的大型桥梁结构健康监测数据异常识别研究[A];第21届全国结构工程学术会议论文集第Ⅱ册[C];2012年
9 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
10 武森;张桂琼;王莹;吴玲玉;;容差集合差异度高维不完备数据聚类[A];第十二届中国管理科学学术年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
5 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年
6 尹可挺;Internet环境中基于QoS的Web服务组合研究[D];浙江大学;2010年
7 李卓;图像信息隐藏与隐写分析算法的研究[D];浙江大学;2010年
8 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
9 李晋江;海量数据点三维重构中一类关键问题研究[D];山东大学;2010年
10 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴晓婷;基于流形学习的数据降维算法的研究[D];辽宁师范大学;2010年
2 刘文昊;基于模糊聚类和纹版辅助的织物疵点检测算法研究[D];浙江理工大学;2010年
3 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
4 丁金凤;基于网格与密度的数据流聚类算法研究[D];哈尔滨工程大学;2010年
5 黄明明;半监督学习方法研究及在警用平台中的应用[D];大连理工大学;2010年
6 刘萍;软件体系结构恢复的研究与实现[D];大连理工大学;2010年
7 李静伟;基于共享近邻的自适应谱聚类算法[D];大连理工大学;2010年
8 孙丽萍;流形学习算法ISOMAP的改进与实现[D];大连理工大学;2010年
9 刘晨;XML文档聚类的研究[D];大连理工大学;2010年
10 桑媛媛;基于非负稀疏表示的文本分类算法研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前6条
1 陈江峰;袁保宗;;直接线性图嵌入算法及其在人脸识别中的应用[J];电子与信息学报;2010年06期
2 王庆军;张汝波;潘海为;;基于核正交局部判别嵌入的人脸识别[J];光电子.激光;2010年09期
3 辜小花;龚卫国;杨利平;;有监督图优化保局投影[J];光学精密工程;2011年03期
4 卢桂馥;王勇;金忠;;基于QR分解的线性图嵌入算法与人脸识别[J];光电工程;2010年09期
5 陈小冬;林焕祥;;稀疏判别分析[J];计算机应用;2012年04期
6 侯俊;郝秀娟;谢德燕;高全学;;二维多样性保持投影及人脸识别[J];西安电子科技大学学报;2012年06期
中国博士学位论文全文数据库 前1条
1 支瑞聪;基于谱图理论的人脸表情识别算法研究[D];北京交通大学;2010年
中国硕士学位论文全文数据库 前2条
1 徐林丰;图嵌入模型及其在数据降维中的应用[D];西安电子科技大学;2011年
2 孙丽娟;基于谱回归的人脸识别的研究[D];重庆大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨斌,聂在平,夏耀先,蒋荣生;基于改进共轭梯度法的前馈网络快速监督学习算法[J];电子学报;2002年12期
2 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期
3 张振跃,查宏远;线性低秩逼近与非线性降维[J];中国科学(A辑:数学);2005年03期
4 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
5 金骏;张道强;;半监督鲁棒联机聚类算法[J];计算机研究与发展;2008年03期
6 张军平,王珏;主曲线研究综述[J];计算机学报;2003年02期
7 邓林,马尽文,裴健;秩和基因选取方法及其在肿瘤诊断中的应用[J];科学通报;2004年13期
8 王开军;张军英;李丹;张新娜;郭涛;;自适应仿射传播聚类[J];自动化学报;2007年12期
9 李昆仑;曹铮;曹丽苹;张超;刘明;;半监督聚类的若干新进展[J];模式识别与人工智能;2009年05期
10 卜东波,白硕,李国杰;文本聚类中权重计算的对偶性策略[J];软件学报;2002年11期
中国博士学位论文全文数据库 前1条
1 时小虎;Elman神经网络与进化算法的若干理论研究及应用[D];吉林大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 李永忠;王汝山;张念贵;王玉雷;;基于半监督模糊聚类的入侵检测技术[J];江苏科技大学学报(自然科学版);2010年04期
2 傅向华,冯博琴,马兆丰,何明;可在线增量自学习的聚焦爬行方法[J];西安交通大学学报;2004年06期
3 丁磊,钱云涛;不同程度的监督机制在自动文本分类中的应用[J];计算机应用与软件;2004年06期
4 张晨光;李玉鑑;;基于半监督学习的眉毛图像分割方法[J];计算机工程与应用;2009年21期
5 刘叶青;刘三阳;谷明涛;;一种多项式光滑的半监督支持向量机分类算法[J];计算机科学;2009年07期
6 杨绪兵;潘志松;陈松灿;;半监督型广义特征值最接近支持向量机[J];模式识别与人工智能;2009年03期
7 鲁珂,赵继东,叶娅兰,曾家智;一种用于图像检索的新型半监督学习算法[J];电子科技大学学报;2005年05期
8 罗进;周学君;;半监督学习中非标记数据的利用[J];湖北大学学报(自然科学版);2008年01期
9 曹慧;刘玉峰;;未标记样本在半监督学习中的应用方法研究[J];广西轻工业;2008年12期
10 王汝山;李永忠;张念贵;王玉雷;;半监督学习在入侵检测系统中的应用[J];广西师范大学学报(自然科学版);2009年03期
中国重要会议论文全文数据库 前10条
1 谷方明;刘大有;王新颖;;基于半监督学习的加权支持向量域数据描述方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 杨源;马云龙;林鸿飞;;基于权重标准化SimRank与半监督学习的产品属性归类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 朱松豪;梁志伟;;用半监督学习方法实现图像检索[A];第二十九届中国控制会议论文集[C];2010年
4 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
5 毕锦烟;李巍华;;基于半监督模糊核聚类的齿轮箱早期故障检测方法[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
6 柳斌;李之棠;涂浩;;一种基于半监督学习的应用层流量分类方法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
7 张召;业宁;业巧林;;基于配对约束的核半监督非线性降维算法[A];第五届全国信息检索学术会议论文集[C];2009年
8 王倩影;冯国灿;汤鑫;;δ-距离及其在半监督增强中的应用[A];第十五届全国图象图形学学术会议论文集[C];2010年
9 冯瑞;宋春林;;一种基于局部学习的复杂系统建模方法[A];2007中国控制与决策学术年会论文集[C];2007年
10 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 孔怡青;半监督学习及其应用研究[D];江南大学;2009年
2 王娇;多视图的半监督学习研究[D];北京交通大学;2010年
3 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
4 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年
5 朱岩;面向文本数据的半监督学习研究[D];北京交通大学;2012年
6 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年
7 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年
8 余国先;高维数据上的半监督学习研究[D];华南理工大学;2013年
9 赵志凯;半监督学习及其在煤矿瓦斯安全信息处理中的应用研究[D];中国矿业大学;2012年
10 任广波;基于半监督学习的遥感影像分类技术研究[D];中国海洋大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈新勇;基于核策略的半监督学习方法研究[D];河北大学;2010年
2 黄明明;半监督学习方法研究及在警用平台中的应用[D];大连理工大学;2010年
3 冯元佶;基于图的半监督学习的改进研究[D];湘潭大学;2010年
4 余养强;半监督学习若干问题的研究[D];福建师范大学;2010年
5 刘伟涛;半监督学习方法及应用研究[D];山东大学;2011年
6 杨伟;半监督学习方法研究[D];国防科学技术大学;2011年
7 魏征丽;基于图半监督学习算法的研究及应用[D];西安电子科技大学;2012年
8 刘孝良;基于半监督学习的随机森林算法研究与应用[D];中国海洋大学;2013年
9 惠成峰;基于半监督学习的电子商务推荐方法[D];南京大学;2013年
10 王竞燕;基于半监督学习的桥梁结构健康分类模型的研究与应用[D];北京工商大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026