收藏本站
《华南理工大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于图的半监督学习理论、算法及应用研究

兰远东  
【摘要】:如何从有限的观测数据中学习是机器学习的一个经典难题。在传统的监督学习中,学习器需要对大量的有标记数据进行学习,从而建立模型来对无法观测的数据或未见数据进行预测。然而当有标记数据的数量较少时,利用它们所训练出的学习器往往很难有较好的泛化性能。在无监督学习中,由于没有标记数据,聚类算法的聚类方向具有不确定性。如何利用少量的标记数据和大量的未标记数据来获得较好的学习器,己经成为当前机器学习研究中最受关注的问题之一。半监督学习研究当有标记的数据较少时如何利用大量的未标记数据来改善学习器的性能,具有广泛的应用领域。 本文在分析了各种半监督学习的研究现状及其目前仍存在的问题的基础上,主要对基于图的半监督学习理论、算法在聚类、分类和降维中的应用进行了研究,主要取得的研究成果如下: 1.提出了一种基于图收缩的半监督聚类算法。首先将样本空间的整个数据集,表示为一个带权图;然后根据约束条件对图进行边收缩的修改,达到增强must-link约束的效果;在此基础上引入图拉普拉斯算子,将cannot-link约束作为一种软约束融入正则化框架。通过对图的修改,实际上就把样本空间投影到了一个子空间,在子空间上进行聚类分析。虽然该算法也使用了图拉普拉斯,但是是在经过边收缩了的图上使用的图拉普拉斯。实验证明,基于图收缩的半监督聚类算法具有较好的聚类精度和较快的聚类速度。 2.提出了一种基于图的半监督学习与主动学习相结合的维数约减算法。该算法将图、半监督学习和基于支持向量机的主动学习相结合,来对高维数据进行降维处理。首先将高维度的观测数据集嵌入到一个带权图中,在图上使用特征映射方法得到高维数据的初始低维嵌入空间;然后在初始嵌入空间中对数据使用基于支持向量机的主动学习,来寻找标记模糊数据并予以标记;再使用基于图的半监督学习,在图嵌入的基础上引入一个吸引子参数使得标记相同的数据在投影子空间中靠得更近;重复上述过程直到满足结束条件。实验表明该算法对高维生物医学图像数据、基因表达数据具有较好的降维效果。 3.提出了一种应用图像分割和半监督学习的图像标注算法。算法充分考虑到了图像的标注与图像局部区域之间的关系,先将图像分割为若干个局部区域,使用局部敏感的哈希表来构建图像局部区域的kNN(k Nearest Neighbours)图;然后基于图像局部区域的kNN图来构建原始图像的kNN图;再利用基于图的半监督标签传递算法来标注未标注的图像。实验证明该算法在获得较高标注精度的同时,也能获得更快的标注速度,并能应用于大型图像数据集。 4.给出了一种通过图像局部区域来计算两个图像之间相似性的方法。设两幅图像分别为I_m和I_n,经过图像分割,分别被分割为p~m和p~n个局部区域,I_m被分割为{r_1~m,r_(p~m)~m},I_n被分割为{r_1~n,...,r_(p~n)~n}。显然,I_m和I_n两图像之间的相似性,只与{r_1~m,r_(p~m)~m}和{r_1~n,...,r_(p~n)~n}相互间的k近邻相关,也就是在图像局部区域的kNN图中有边相连的局部区域对。因此在本文中给出了一种根据图像局部区域的kNN图来计算图像之间的相似性的方法。 5.给出了一种寻找样本k近邻的方法。该方法通过哈希表和样本局部属性的kNN图来寻找样本的k近邻。实验表明该方法寻找k近邻的速度要高于线性扫描寻找k近邻。
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP181

知网文化
【参考文献】
中国期刊全文数据库 前4条
1 鲍泓;徐光美;冯松鹤;须德;;自动图像标注技术研究进展[J];计算机科学;2011年07期
2 卢汉清;刘静;;基于图学习的自动图像标注[J];计算机学报;2008年09期
3 尹学松;胡思良;陈松灿;;基于成对约束的判别型半监督聚类分析[J];软件学报;2008年11期
4 魏莱;王守觉;;基于流形距离的半监督判别分析[J];软件学报;2010年10期
【共引文献】
中国期刊全文数据库 前10条
1 刘金红;陆余良;施凡;宋舜宏;;基于语义上下文分析的因特网人物信息挖掘[J];安徽大学学报(自然科学版);2009年04期
2 李大林;陈一帆;蔡润;;多性状群体信息熵混杂递增链与混杂指数的应用[J];安徽农业科学;2008年13期
3 张涛;;提高离散数学课程学习兴趣的教学改革探讨[J];安徽工业大学学报(社会科学版);2012年01期
4 钟尚平;林静;;一个基于TSVM的GIF图像通用隐写检测方法[J];北京交通大学学报;2009年02期
5 秦洋;王立宏;武栓虎;宋宜斌;;基于拉普拉斯矩阵的DNA序列集相似性分析[J];北京交通大学学报;2009年06期
6 高吉;;在ArcGIS矢量图中搜寻最短路径的实现[J];北京测绘;2009年02期
7 刘宏岚;高庆狮;杨炳儒;;多值逻辑中的命题相关性与逻辑运算研究[J];北京科技大学学报;2007年S2期
8 刘宏岚;高庆狮;杨炳儒;;概率逻辑中的命题相关性与逻辑运算[J];北京科技大学学报;2008年09期
9 王郁昕;互逆主义逻辑基础[J];北京联合大学学报(自然科学版);2005年02期
10 薛朝奎;;“构造法”在图论中的应用——关于存在性的证明[J];毕节学院学报(综合版);2006年04期
中国重要会议论文全文数据库 前10条
1 朱琳;;声纳系统设计与调试中图论方法研究[A];2011'中国西部声学学术交流会论文集[C];2011年
2 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
3 孙兆豪;李昂;刘坤起;解建军;;论代数、逻辑和智能系统之间的对应关系[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
4 徐云峰;;一种新的取证计算模型的研究与实现[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
5 秦朗;;基于二叉树多层分类SVM的脱机手写体汉字识别[A];第十九届测控、计量、仪器仪表学术年会(MCMI'2009)论文集[C];2009年
6 方昕;钟尚平;;基于聚类与TSVM融合的图像通用隐写检测算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
7 王天芳;袁世宏;;证候/证候要素研究的分类假说与方法[A];中国中西医结合学会诊断专业委员会2009’年会论文集[C];2009年
8 王小磊;张瑾;许洪波;;基于交互增强原理的多文档自动文摘算法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 王桐;刘大昕;田迪;孙伟;张万松;;一种改进的XML向量空间模型及其近似匹配算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
10 庄传志;张道强;;多视角判别聚类算法[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
中国博士学位论文全文数据库 前10条
1 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
2 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
3 宋军;水交换模型的理论方法及应用研究[D];中国海洋大学;2010年
4 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
5 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
6 杨国鹏;基于机器学习方法的高光谱影像分类研究[D];解放军信息工程大学;2010年
7 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
8 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
9 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
10 许相莉;基于智能计算的图像检索算法研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 左国辉;基于子空间方法的人脸识别技术研究[D];哈尔滨工程大学;2009年
3 杨欣颖;潜器光视觉目标识别技术的研究与设计[D];哈尔滨工程大学;2010年
4 代丽洁;自然场景图像的自动标注方法研究[D];哈尔滨工程大学;2010年
5 黄明明;半监督学习方法研究及在警用平台中的应用[D];大连理工大学;2010年
6 李静伟;基于共享近邻的自适应谱聚类算法[D];大连理工大学;2010年
7 桑媛媛;基于非负稀疏表示的文本分类算法研究[D];大连理工大学;2010年
8 蒋延生;基于图的适应性相似度估算的半监督学习[D];大连理工大学;2010年
9 孙玉侠;数据挖掘中的谱聚类算法研究[D];中国海洋大学;2010年
10 赵群;极小化标注的音频分类和句子切分的研究[D];中国海洋大学;2010年
【二级参考文献】
中国期刊全文数据库 前4条
1 王玲;薄列峰;焦李成;;密度敏感的谱聚类[J];电子学报;2007年08期
2 罗四维;赵连伟;;基于谱图理论的流形学习算法[J];计算机研究与发展;2006年07期
3 张元清;包骏杰;况夯;钟洪;;基于贝叶斯理论的图像标注和检索[J];计算机科学;2008年08期
4 卢汉清;刘静;;基于图学习的自动图像标注[J];计算机学报;2008年09期
中国博士学位论文全文数据库 前1条
1 赵玉凤;图像检索中自动标注技术的研究[D];北京交通大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 李永忠;王汝山;张念贵;王玉雷;;基于半监督模糊聚类的入侵检测技术[J];江苏科技大学学报(自然科学版);2010年04期
2 傅向华,冯博琴,马兆丰,何明;可在线增量自学习的聚焦爬行方法[J];西安交通大学学报;2004年06期
3 丁磊,钱云涛;不同程度的监督机制在自动文本分类中的应用[J];计算机应用与软件;2004年06期
4 张晨光;李玉鑑;;基于半监督学习的眉毛图像分割方法[J];计算机工程与应用;2009年21期
5 刘叶青;刘三阳;谷明涛;;一种多项式光滑的半监督支持向量机分类算法[J];计算机科学;2009年07期
6 杨绪兵;潘志松;陈松灿;;半监督型广义特征值最接近支持向量机[J];模式识别与人工智能;2009年03期
7 鲁珂,赵继东,叶娅兰,曾家智;一种用于图像检索的新型半监督学习算法[J];电子科技大学学报;2005年05期
8 罗进;周学君;;半监督学习中非标记数据的利用[J];湖北大学学报(自然科学版);2008年01期
9 曹慧;刘玉峰;;未标记样本在半监督学习中的应用方法研究[J];广西轻工业;2008年12期
10 王汝山;李永忠;张念贵;王玉雷;;半监督学习在入侵检测系统中的应用[J];广西师范大学学报(自然科学版);2009年03期
中国重要会议论文全文数据库 前10条
1 谷方明;刘大有;王新颖;;基于半监督学习的加权支持向量域数据描述方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 杨源;马云龙;林鸿飞;;基于权重标准化SimRank与半监督学习的产品属性归类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 朱松豪;梁志伟;;用半监督学习方法实现图像检索[A];第二十九届中国控制会议论文集[C];2010年
4 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
5 毕锦烟;李巍华;;基于半监督模糊核聚类的齿轮箱早期故障检测方法[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
6 柳斌;李之棠;涂浩;;一种基于半监督学习的应用层流量分类方法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
7 张召;业宁;业巧林;;基于配对约束的核半监督非线性降维算法[A];第五届全国信息检索学术会议论文集[C];2009年
8 王倩影;冯国灿;汤鑫;;δ-距离及其在半监督增强中的应用[A];第十五届全国图象图形学学术会议论文集[C];2010年
9 冯瑞;宋春林;;一种基于局部学习的复杂系统建模方法[A];2007中国控制与决策学术年会论文集[C];2007年
10 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 赵艳秋李映;DSP核供应商灵活应对潜力应用[N];中国电子报;2007年
2 张韵萍苏小兰 李宾;对抗“震魔”的科技武器[N];中国经营报;2008年
3 记者 陈全育;风云三号02星传回首张图像[N];中国航天报;2010年
4 韩霁;高新技术在抗震救灾中得到应用[N];经济日报;2008年
5 ;系统加密防破解[N];中国计算机报;2008年
6 本报通讯员 刘磊;观天测云 努力不止[N];中国气象报;2011年
7 李晓萍;探测生命的“四种武器”[N];人民公安报;2008年
8 张显峰;机载干涉SAR系统掀起测绘革命[N];中国矿业报;2004年
9 山东 猫咪老爸;图像拼接 天衣无缝[N];电脑报;2003年
10 本报记者 王繁泓;定华:破解储罐液位测量难题[N];中国化工报;2006年
中国博士学位论文全文数据库 前10条
1 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
2 王娇;多视图的半监督学习研究[D];北京交通大学;2010年
3 孔怡青;半监督学习及其应用研究[D];江南大学;2009年
4 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年
5 朱岩;面向文本数据的半监督学习研究[D];北京交通大学;2012年
6 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年
7 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年
8 赵志凯;半监督学习及其在煤矿瓦斯安全信息处理中的应用研究[D];中国矿业大学;2012年
9 任广波;基于半监督学习的遥感影像分类技术研究[D];中国海洋大学;2010年
10 薛贞霞;支持向量机及半监督学习中若干问题的研究[D];西安电子科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈新勇;基于核策略的半监督学习方法研究[D];河北大学;2010年
2 梁;基于多目标函数改进的多核学习在半监督学习和迁移学习场景中的应用[D];中山大学;2011年
3 卢加磊;半监督学习中协同训练与多视图方法的比较及改进[D];中国海洋大学;2010年
4 黄明明;半监督学习方法研究及在警用平台中的应用[D];大连理工大学;2010年
5 冯元佶;基于图的半监督学习的改进研究[D];湘潭大学;2010年
6 余养强;半监督学习若干问题的研究[D];福建师范大学;2010年
7 刘伟涛;半监督学习方法及应用研究[D];山东大学;2011年
8 杨伟;半监督学习方法研究[D];国防科学技术大学;2011年
9 魏征丽;基于图半监督学习算法的研究及应用[D];西安电子科技大学;2012年
10 杨伟;基于半监督学习的遥感影像分类[D];上海交通大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026