收藏本站
《中国科学技术大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于图的半监督学习和维数约简方法及其应用研究

桂杰  
【摘要】: 半监督学习和维数约简已经成为当前机器学习领域的研究热点。半监督学习研究的目的是在整个数据集中只有一部分样本有标记的情况下,如何对数据进行分类。本文主要研究的是基于图的半监督学习方法与应用。维数约简是在尽可能多地保持数据集结构的前提下,将数据集转换成一个新的数据集,新数据集的维数是原始数据集的本征维数。本文对基于图的半监督学习和维数约简方法与应用进行了系统的研究,具体来说,全文的主要工作概括如下: (1)提出了一种新的多步骤降维方法对基因表达谱数据进行降维。首先采用秩和检验方法来进行差异表达的基因选择,然后将排在前面的一定数量的基因再进行离散余弦变换,并采用主成分分析对变换后的系数进行主成分提取。我们首先将基于图的半监督方法引入到肿瘤分类中,采用基于图的半监督学习算法对抽取的主成分特征进行分类性能评估。 (2)针对基于图的半监督学习方法提出了一种新的自适应权值学习方法。传统的基于图的半监督学习算法大都采用高斯函数来计算图的边权。我们提出一种新颖的针对基于图的半监督学习方法的边权设计方法。该方法添加了标签信息,并且采用测地距离而不是欧氏距离来计算两个样本点之间的距离。此外,我们还添加了类的先验信息,并针对基于局部和全局一致性的学习方法来改进边权。实验结果表明,我们所提出的方法要优于原算法。 (3)提出了一种基于局部保持投影的监督特征提取方法,即局部保持判别投影算法。局部保持投影(LPP)没有加入判别信息,仅仅考虑局部信息。我们将类内散度矩阵和类间散度矩阵加入到LPP的目标函数中,从而提出局部保持判别投影(LPDP)方法。该方法的优点是能够最大化类间距离和最小化类内距离,同时保持LPP的局部保持特性。LPDP可被看作是一种组合了流形准则和Fisher准则的新方法。因此,与LPP相比,LPDP能够成功地找到具有更好判别性能的子空间,因而更适合于做分类,从而能有效地提高识别率。 (4)提出了基于谱回归的判别分析(Spectral Regression Discriminant Analysis, SRDA)和基于谱回归的核化判别分析(Spectral Regression Kernel DiscriminantAnalysis, SRXDA)的正则化参数估计方法。SRDA的正则化参数的估计在以往的研究中没有得到很好的解决。我们基于扰动的线性判别分析(Perturbation Linear Discriminant Analysis, PLDA)准则提出一种新的方法,来估计SRDA的正则化参数。在另一方面,SRKDA的正则化参数估计在以前的研究中也没有解决。我们提出两种方法来估计SRKDA的正则化参数,在不同数据集上的实验结果显示我们的方法是有效可行的。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP181

知网文化
【引证文献】
中国博士学位论文全文数据库 前2条
1 吕佳;基于局部学习的半监督分类问题研究[D];内蒙古大学;2012年
2 王广学;UWB SAR叶簇隐蔽目标变化检测技术研究[D];国防科学技术大学;2012年
中国硕士学位论文全文数据库 前1条
1 秦高峰;基于机器学习的多光谱遥感影像分类及城市扩展研究[D];重庆大学;2012年
【共引文献】
中国期刊全文数据库 前10条
1 庄振华;王年;李学俊;梁栋;王继;;癌症基因表达数据的熵度量分类方法[J];安徽大学学报(自然科学版);2010年02期
2 陈乐;王年;苏亮亮;王蕊平;;基于邻接谱主分量分析的肿瘤分类方法[J];安徽大学学报(自然科学版);2011年04期
3 叶爱霞;王年;苏亮亮;;基于非负矩阵分解和Normal_Matrix的肿瘤基因分类[J];安徽大学学报(自然科学版);2012年03期
4 牟少敏;田盛丰;尹传环;;基于协同聚类的多核学习[J];北京交通大学学报;2008年02期
5 刘利;韦佳;马千里;;基于流形学习的图像检索研究进展[J];北京交通大学学报;2010年05期
6 尚坤;李培军;程涛;;基于合成核支持向量机的高光谱土地覆盖分类[J];北京大学学报(自然科学版);2011年01期
7 文翰;肖南峰;;基于特征分布的半监督分类[J];北京工业大学学报;2012年01期
8 陈斌;阎兆立;程晓斌;;旋转设备声学故障特征提取与优化方法[J];北京邮电大学学报;2011年04期
9 赵三元;沈庭芝;孙晨升;刘朋樟;岳雷;;Feature subset selection method for AdaBoost training[J];Journal of Beijing Institute of Technology;2011年03期
10 童姗姗;窦霁虹;贾玲;王佳颖;;基于实例的基因分类及确定基因标签模型[J];纯粹数学与应用数学;2011年04期
中国重要会议论文全文数据库 前10条
1 武进;尹恺;王长明;张家才;;SVDM在蔬菜病害图像分类中的应用[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
2 赵玲玲;周水生;王雪岩;;基于集成算法的半监督学习[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
3 刘欣;章勇;王娟;;增量学习的TFIDF_NB协同训练分类算法[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
4 任伟;闫桂英;;利用聚类算法来研究基因选择问题[A];中国运筹学会第八届学术交流会论文集[C];2006年
5 ;Sensor Fault Detection and Identification using Kernel PCA and Its Fast Data Reconstruction[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
6 ;Final Sulfur Content Prediction Model in Hot Metal Desulphurization Process Based on IEA-SVM[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
7 陈益定;郑树;余捷凯;;血清蛋白质指纹图谱在大肠癌早期诊断中的应用[A];第三届中国肿瘤学术大会教育论文集[C];2004年
8 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
9 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 贲晛烨;基于人体运动分析的步态识别算法研究[D];哈尔滨工程大学;2010年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
5 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年
6 章鹏;多尺度特征检测:方法和应用研究[D];中国科学技术大学;2010年
7 吕宁;基于数据驱动的故障诊断模型及算法研究[D];哈尔滨理工大学;2009年
8 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
9 吕青;思维进化和支持向量机理论及其在炼焦配煤优化中的应用研究[D];太原理工大学;2011年
10 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 吴晓婷;基于流形学习的数据降维算法的研究[D];辽宁师范大学;2010年
2 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年
3 严康;基于支持向量机的特征选择算法研究[D];大连理工大学;2010年
4 蒋延生;基于图的适应性相似度估算的半监督学习[D];大连理工大学;2010年
5 孔健;基于半监督学习的社团划分算法研究[D];辽宁师范大学;2010年
6 卢加磊;半监督学习中协同训练与多视图方法的比较及改进[D];中国海洋大学;2010年
7 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
8 朱莹婷;基于迁移学习理论的Markov检索模型[D];江西师范大学;2010年
9 张庆久;近邻法与多视角学习的理论与算法研究[D];华东师范大学;2011年
10 赵丹;基于SVM分类机的DNA序列分类方法[D];南昌大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 李明杰;钱乐祥;吴志峰;崔海山;侯西勇;;广州市海珠区高密度城区扩展SLEUTH模型模拟[J];地理学报;2010年10期
2 刘盛和,吴传钧,陈田;评析西方城市土地利用的理论研究[J];地理研究;2001年01期
3 廖和平;彭征;洪惠坤;程希;;重庆市直辖以来的城市空间扩展与机制[J];地理研究;2007年06期
4 吴晓青;胡远满;贺红士;布仁仓;郗凤明;;沈阳市城市扩展与土地利用变化多情景模拟[J];地理研究;2009年05期
5 臧宏志,徐建政,俞晓冬;基于多种人工智能技术集成的电力变压器故障诊断[J];电网技术;2003年03期
6 韦燕凤,赵忠明,闫冬梅,曾庆业;基于特征的遥感图像自动配准算法[J];电子学报;2005年01期
7 黄勇,王建国,黄顺吉;一种SAR图像的自动匹配算法及实现[J];电子与信息学报;2005年01期
8 曹广真;侯鹏;金亚秋;毛显强;;基于改进证据理论的多时相微波遥感图像融合及在城区地表变化检测中的应用[J];电子与信息学报;2008年08期
9 张石清;李乐民;赵知劲;;基于一种改进的监督流形学习算法的语音情感识别[J];电子与信息学报;2010年11期
10 尤红建;詹芊芊;;组合Edgeworth逼近和交叉熵的SAR变化检测[J];电子与信息学报;2011年01期
中国博士学位论文全文数据库 前9条
1 杨国鹏;基于机器学习方法的高光谱影像分类研究[D];解放军信息工程大学;2010年
2 赖志辉;基于流形学习的稀疏人脸特征提取[D];南京理工大学;2011年
3 刘笑嶂;核方法的若干关键问题研究及其在人脸图像分析中的应用[D];中山大学;2010年
4 舒帮荣;基于约束性模糊元胞自动机的城镇用地扩展模拟研究[D];南京农业大学;2010年
5 胡崇海;基于图的半监督机器学习[D];浙江大学;2008年
6 黄鸿;图嵌入框架下流形学习理论及应用研究[D];重庆大学;2008年
7 吕金建;基于特征的多源遥感图像配准技术研究[D];国防科学技术大学;2008年
8 李新刚;基于元胞自动机模型的交通系统微观建模与特性研究[D];北京交通大学;2010年
9 代娟;基于SLEUTH模型的区域空间演变模拟[D];中国地质大学;2010年
中国硕士学位论文全文数据库 前2条
1 米丽娜;基于SLEUTH模型的银川市空间扩展研究[D];兰州大学;2008年
2 李辉;基于SLEUTH模型的银川平原城市扩展研究[D];兰州大学;2010年
【二级引证文献】
中国硕士学位论文全文数据库 前2条
1 石丽;输电线路绝缘子缺陷图像检测方法[D];华北电力大学;2013年
2 张明涛;高效ELM建模方法及其在填料塔重要参数预测的研究[D];浙江工业大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 李妍妍;李媛媛;叶世伟;;基于流形正则化的支持向量回归及应用[J];计算机应用;2007年08期
2 李永忠;王汝山;张念贵;王玉雷;;基于半监督模糊聚类的入侵检测技术[J];江苏科技大学学报(自然科学版);2010年04期
3 傅向华,冯博琴,马兆丰,何明;可在线增量自学习的聚焦爬行方法[J];西安交通大学学报;2004年06期
4 丁磊,钱云涛;不同程度的监督机制在自动文本分类中的应用[J];计算机应用与软件;2004年06期
5 张晨光;李玉鑑;;基于半监督学习的眉毛图像分割方法[J];计算机工程与应用;2009年21期
6 刘叶青;刘三阳;谷明涛;;一种多项式光滑的半监督支持向量机分类算法[J];计算机科学;2009年07期
7 杨绪兵;潘志松;陈松灿;;半监督型广义特征值最接近支持向量机[J];模式识别与人工智能;2009年03期
8 鲁珂,赵继东,叶娅兰,曾家智;一种用于图像检索的新型半监督学习算法[J];电子科技大学学报;2005年05期
9 罗进;周学君;;半监督学习中非标记数据的利用[J];湖北大学学报(自然科学版);2008年01期
10 曹慧;刘玉峰;;未标记样本在半监督学习中的应用方法研究[J];广西轻工业;2008年12期
中国重要会议论文全文数据库 前10条
1 谷方明;刘大有;王新颖;;基于半监督学习的加权支持向量域数据描述方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 杨源;马云龙;林鸿飞;;基于权重标准化SimRank与半监督学习的产品属性归类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 朱松豪;梁志伟;;用半监督学习方法实现图像检索[A];第二十九届中国控制会议论文集[C];2010年
4 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
5 毕锦烟;李巍华;;基于半监督模糊核聚类的齿轮箱早期故障检测方法[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
6 柳斌;李之棠;涂浩;;一种基于半监督学习的应用层流量分类方法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
7 张召;业宁;业巧林;;基于配对约束的核半监督非线性降维算法[A];第五届全国信息检索学术会议论文集[C];2009年
8 王倩影;冯国灿;汤鑫;;δ-距离及其在半监督增强中的应用[A];第十五届全国图象图形学学术会议论文集[C];2010年
9 冯瑞;宋春林;;一种基于局部学习的复杂系统建模方法[A];2007中国控制与决策学术年会论文集[C];2007年
10 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 孔怡青;半监督学习及其应用研究[D];江南大学;2009年
2 王娇;多视图的半监督学习研究[D];北京交通大学;2010年
3 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
4 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年
5 朱岩;面向文本数据的半监督学习研究[D];北京交通大学;2012年
6 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年
7 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年
8 余国先;高维数据上的半监督学习研究[D];华南理工大学;2013年
9 赵志凯;半监督学习及其在煤矿瓦斯安全信息处理中的应用研究[D];中国矿业大学;2012年
10 任广波;基于半监督学习的遥感影像分类技术研究[D];中国海洋大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈新勇;基于核策略的半监督学习方法研究[D];河北大学;2010年
2 黄明明;半监督学习方法研究及在警用平台中的应用[D];大连理工大学;2010年
3 冯元佶;基于图的半监督学习的改进研究[D];湘潭大学;2010年
4 余养强;半监督学习若干问题的研究[D];福建师范大学;2010年
5 刘伟涛;半监督学习方法及应用研究[D];山东大学;2011年
6 杨伟;半监督学习方法研究[D];国防科学技术大学;2011年
7 魏征丽;基于图半监督学习算法的研究及应用[D];西安电子科技大学;2012年
8 刘孝良;基于半监督学习的随机森林算法研究与应用[D];中国海洋大学;2013年
9 惠成峰;基于半监督学习的电子商务推荐方法[D];南京大学;2013年
10 王竞燕;基于半监督学习的桥梁结构健康分类模型的研究与应用[D];北京工商大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026