收藏本站
《南京理工大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

流形学习理论与算法研究

孙明明  
【摘要】: 随着信息技术的发展,人们需要处理的数据越来越复杂。这些数据的内在规律的复杂性往往超出人们的直接感知能力,人们必须借助机器学习方法来从数据中学习并发现内在规律。流形学习方法便是近年来出现的一个重要的机器学习领域,在探索非线性数据的内在规律等方面取得了令人瞩目的成果。 本文从学习结果应当有利于人们对数据集内部结构认知的思想出发,深入分析了非监督学习的特征提取任务和数据拓扑结构描述任务对流形学习模型与算法的要求,并讨论了现有主要流形学习理论和算法与这些要求的相容性。对于非监督特征提取任务,本文提出了流形学习理论与算法应当遵循的两个准则:“重构误差最小化”准则与“相似性保持”准则,以保证人们通过提取的特征,能够正确地理解数据集的内在性质。以这两个准则为标准,本文澄清了非监督特征提取任务中过拟合与欠拟合的概念,提出了对特征提取算法的评价标准,并深入地分析了现有多种主要流形学习理论和算法存在的问题,指出目前尚无满足此二准则的流形学习理论模型。对于数据拓扑结构描述任务,本文指出,为使人们能够正确且直观地认知数据集的拓扑结构,拓扑结构学习模型与算法应当具有较强的拓扑结构生成能力,且在其学习结果与数据集的拓扑结构之间建立起对应关系。根据此标准,本文分析并比较了现有的多种拓扑结构学习理论与算法,发现这些理论与算法无法很好地实现上述要求,从而在准确并直观地表达数据的拓扑结构方面存在缺憾。为解决当前流形学习理论与算法中存在的上述问题,本文开展了以下几个方面的研究: (一)本文基于非监督特征提取任务的“重构误差最小化”准则与“相似性保持”准则,提出了“相似性保持主曲线”的概念,证明了其存在性,研究了其微分性质并将其推广到高维情形。相似性保持主曲线理论的意义在于其在保持数据之间相似关系不变的条件下,取得对数据的最佳逼近,因此是特征提取任务的最优一维特征提取模型。相似性保持主曲线及其高维推广的理论完善了流形学习理论,可以做为特征提取任务下流形学习算法的理论目标,具有重要的理论意义。本文提出了相似性保持主曲线的一个学习算法。在仿真数据集与真实数据集上的试验结果表明了该学习算法的有效性,从而验证了相似性保持主曲线理论的合理性。 (二)本文针对现有嵌入流形学习方法在面临一些具有强非线性性质的数据集时出现欠拟合现象的问题,提出了一种新的嵌入算法——“全局拉普拉斯特征映射”算法。与LLE等局部方法相比,该算法在考虑数据集的局部信息的同时,还考虑了数据集的全局信息;而与ISOMap等全局方法相比,该算法以一种更加灵活的方式来处理数据的全局信息,从而避免了ISOMap方法拘泥于保持全局流形距离带来的局限。在一些具有强非线性性质的数据集上的实验结果表明,该算法获得了低于大多数甚至所有其他参测嵌入方法的重构误差。 (三)本文以使人们能够直观地认知数据集的拓扑结构为目的,提出了数据集的“主拓扑”与“拓扑图”的概念。数据的主拓扑概念表征数据最显著的拓扑特征,而拓扑图则是对主拓扑的简明表达。在数据集的拓扑图与主拓扑之间存在着拓扑结构的一一对应关系,这种关系使得人们能够通过拓扑图直观地了解数据的最显著的拓扑特征。本文提出了拓扑图学习的分割-组合学习策略。基于该策略,本文提出了拓扑图学习的增长聚类算法。该算法在仿真数据集以及现实应用中都取得了比较好的效果。
【学位授予单位】:南京理工大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP181

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 蒋敏;叶龙;;基于流形的图像检索算法的研究[J];中国传媒大学学报(自然科学版);2011年01期
2 王博;刘美玲;张学敏;;两种流形学习算法的对比研究[J];微型机与应用;2013年08期
中国博士学位论文全文数据库 前7条
1 符茂胜;局部保持的流形学习理论及其在视觉信息分析中的应用[D];安徽大学;2010年
2 赵才荣;基于图嵌入与视觉注意的特征抽取[D];南京理工大学;2011年
3 王广斌;基于流形学习的旋转机械故障诊断方法研究[D];中南大学;2010年
4 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
5 张沐光;基于局部—全局结构分析的统计过程监测方法研究[D];浙江大学;2011年
6 薛丰昌;空间信息复合分析模型研究[D];中国矿业大学;2008年
7 邵宝民;海洋图像智能信息提取方法研究[D];中国海洋大学;2011年
中国硕士学位论文全文数据库 前10条
1 马洪民;暴雨中冰雹的识别[D];天津大学;2010年
2 张长帅;基于图的半监督学习及其应用研究[D];南京航空航天大学;2011年
3 赵丰富;基于流形学习的杂草种子识别的研究[D];西北农林科技大学;2011年
4 闫志敏;基于流形学习的数据约简方法研究与应用[D];山东师范大学;2012年
5 付会欣;李群机器学习中的辛群分类器研究[D];苏州大学;2008年
6 张炯;基于流形学习的纤维丛学习算法研究[D];苏州大学;2008年
7 李昱;半监督流形学习算法研究和应用[D];西安电子科技大学;2010年
8 吴风玲;基于流形学习的肿瘤基因表达数据分类研究[D];曲阜师范大学;2010年
9 薛广鑫;基于流形学习的汽轮机振动故障诊断方法研究[D];东北电力大学;2012年
10 葛爽;基于虚拟仪器的齿轮箱故障诊断的试验平台开发[D];华南理工大学;2013年
【参考文献】
中国期刊全文数据库 前4条
1 詹德川,周志华;基于集成的流形学习可视化[J];计算机研究与发展;2005年09期
2 张军平,王珏;主曲线研究综述[J];计算机学报;2003年02期
3 何力;张军平;周志华;;基于放大因子和延伸方向研究流形学习算法[J];计算机学报;2005年12期
4 赵连伟,罗四维,赵艳敞,刘蕴辉;高维数据流形的低维嵌入及嵌入维数研究[J];软件学报;2005年08期
【共引文献】
中国期刊全文数据库 前10条
1 赵连伟;罗四维;廖灵芝;田媚;;主曲线构建算法研究[J];北京交通大学学报;2006年02期
2 万春红;邵超;;一种新的基于自组织映射的流形学习算法[J];北京交通大学学报;2009年06期
3 黄天羽;李立杰;胡希胜;;基于样本的等距特征映射的行为分析方法[J];北京理工大学学报;2011年05期
4 赵继东;鲁珂;吴跃;;保局投影算法的优化研究[J];电子科技大学学报;2008年05期
5 吴晓婷;马玉梅;;高维数据流形的低维嵌入问题研究[J];大连民族学院学报;2008年05期
6 王一;杨俊安;刘辉;;基于保局判别投影的声目标特征提取算法[J];电路与系统学报;2011年05期
7 李小丽;薛清福;;几种流形学习算法的比较研究[J];电脑与信息技术;2009年03期
8 苗夺谦,张红云,李道国,王真;基于主曲线的脱机手写数字识别[J];电子学报;2005年09期
9 苏菡;黄凤岗;;一种基于主曲线的步态识别方法[J];电子学报;2007年09期
10 王开军;;基于降维的聚类可视化技术[J];福建师范大学学报(自然科学版);2011年04期
中国重要会议论文全文数据库 前3条
1 董冀媛;穆志纯;欧阳定恒;;基于最大线性片划分的局部切空间排列算法及在多姿态人耳识别中的应用[A];第二十九届中国控制会议论文集[C];2010年
2 董广军;纪松;朱朝杰;;基于局部线性嵌入流形学习的高光谱影像分类技术[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
3 张春莹;潘荣江;;基于主曲线的平面点云B样条开曲线拟合方法[A];中国几何设计与计算新进展2007——第三届中国几何设计与计算大会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 邵纪东;非线性过程监测中的数据降维及相关问题研究[D];浙江大学;2010年
2 符茂胜;局部保持的流形学习理论及其在视觉信息分析中的应用[D];安徽大学;2010年
3 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
4 雷迎科;流形学习算法及其应用研究[D];中国科学技术大学;2011年
5 刘永斌;基于非线性信号分析的滚动轴承状态监测诊断研究[D];中国科学技术大学;2011年
6 李伟;复杂网络特征结构的挖掘方法研究[D];南京理工大学;2010年
7 赵才荣;基于图嵌入与视觉注意的特征抽取[D];南京理工大学;2011年
8 王广斌;基于流形学习的旋转机械故障诊断方法研究[D];中南大学;2010年
9 杜健辉;基于旋转电弧传感的水下焊缝成形及自动跟踪的研究[D];华南理工大学;2011年
10 蒋胜利;高维数据的特征选择与特征提取研究[D];西安电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 季浩;非线性系统的规律维及其可视化方法初探[D];合肥工业大学;2010年
2 贾晓哲;实用约束主曲线算法研究及应用[D];北京交通大学;2011年
3 李凯;健壮的流形学习算法及其应用研究[D];福建师范大学;2010年
4 梅铮;商业数据流降维方法及其聚类算法研究[D];浙江工商大学;2011年
5 魏博兰;半监督流形学习算法在视频分析中的应用[D];西安电子科技大学;2011年
6 杜文霞;人脸识别中的特征提取算法研究[D];兰州理工大学;2011年
7 陈涛;导轨磨耗激光图像测量的嵌入式系统研究与设计[D];电子科技大学;2011年
8 姚晨;高纬数据流的异常检测[D];电子科技大学;2011年
9 胡三和;鲁棒流形学习算法研究[D];西安电子科技大学;2011年
10 左加阔;基于流形学习算法的新生儿疼痛表情识别[D];南京邮电大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 赵连伟;罗四维;廖灵芝;田媚;;主曲线构建算法研究[J];北京交通大学学报;2006年02期
2 谭衢霖;刘正军;沈伟;;一种面向对象的遥感影像多尺度分割方法[J];北京交通大学学报;2007年04期
3 秦志强;数据融合技术及其应用[J];兵工自动化;2003年05期
4 徐宗本;樊忠泽;;基于云神经网络的空间推进系统故障检测与诊断[J];兵工学报;2009年06期
5 李源,何清,史忠植;基于概念语义空间的联想检索[J];北京科技大学学报;2001年06期
6 薛建安;;多状态系统分析问题的若干理论结果[J];北京轻工业学院学报;1985年01期
7 杨帆;米红;;一种基于网格的空间聚类方法在区域划分中的应用[J];测绘科学;2007年S1期
8 高建新;;GIS空间数据研究[J];测绘科技情报;2006年01期
9 郭黎;崔铁军;王玉海;卢晨琰;;多源空间数据融合技术探讨[J];地理信息世界;2007年01期
10 邓敏;李志林;程涛;;多粒度的GIS数据不确定性粗集表达[J];测绘学报;2006年01期
中国博士学位论文全文数据库 前10条
1 王广斌;基于流形学习的旋转机械故障诊断方法研究[D];中南大学;2010年
2 骆正虎;移动Agent系统若干关键技术问题研究[D];合肥工业大学;2002年
3 陈东方;辛几何理论和小波变换方法在波动方程高频近似中的应用[D];安徽大学;2003年
4 黄逸民;基于多Agent的智能管理信息系统理论与应用研究[D];浙江大学;2002年
5 王正群;手写体汉字识别研究[D];南京理工大学;2001年
6 杨健;线性投影分析的理论与算法及其在特征抽取中的应用研究[D];南京理工大学;2002年
7 徐铭杰;遥感图像数据挖掘体系与实现技术研究[D];中国人民解放军信息工程大学;2003年
8 郭明;基于数据驱动的流程工业性能监控与故障诊断研究[D];浙江大学;2004年
9 陈才扣;基于核的非线性特征抽取与图象识别研究[D];南京理工大学;2004年
10 谢磊;间歇过程统计性能监控研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 张振华;粗集理论及其在数据预处理过程中的应用[D];昆明理工大学;2002年
2 吴艳冬;复杂背景中的人脸检测与定位[D];大连理工大学;2002年
3 黄添强;基于空间数据挖掘的环境调控空间决策支持系统研究[D];福州大学;2003年
4 陈新国;基于小波分析的齿轮故障诊断的研究[D];武汉科技大学;2004年
5 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
6 吴海燕;Agent协商策略与联盟机制研究[D];福州大学;2006年
7 张晓芸;彩色图像分割算法的研究与实现[D];重庆大学;2005年
8 郑守志;基于流形学习理论的空间信息源研究及应用[D];中国科学院研究生院(计算技术研究所);2006年
9 李丽敏;自相交流形学习方法[D];浙江大学;2006年
10 肖健;局部线性嵌入的流形学习算法研究与应用[D];国防科学技术大学;2005年
【二级引证文献】
中国期刊全文数据库 前3条
1 刘小平;许桂云;任世锦;杨茂云;;形态梯度小波降噪与S变换的齿轮故障特征抽取算法[J];电子设计工程;2012年22期
2 徐玉龙;王金明;吴文;陈志伟;;一种基于流形与特征融合的说话人识别方法[J];军事通信技术;2012年03期
3 薛丰昌;;GIS-MCE技术在农业气象灾害风险评价中的应用[J];气象;2012年09期
中国重要会议论文全文数据库 前1条
1 薛丰昌;沈东东;;GIS-MCE在农业气象灾害风险评价中的应用[A];地理信息与物联网论坛暨江苏省测绘学会2010年学术年会论文集[C];2010年
中国博士学位论文全文数据库 前5条
1 贺英;基于半监督和迁移学习的近红外光谱建模方法研究[D];中国海洋大学;2012年
2 万川;基于动态序列图像的人脸表情识别系统理论与方法研究[D];吉林大学;2013年
3 祝志博;融合聚类分析的故障检测和分类研究[D];浙江大学;2012年
4 郭海儒;注意的生成机制与视觉注意计算模型研究[D];北京邮电大学;2012年
5 刘小平;提升机故障智能诊断理论及应用[D];中国矿业大学;2013年
中国硕士学位论文全文数据库 前10条
1 郭全;基于MDS-FCM的可视化操作优化方法研究[D];武汉理工大学;2011年
2 晋小玲;图转导理论的研究与应用[D];华北电力大学(北京);2011年
3 李哲;基于半监督回归的多模型在线软测量系统研究[D];上海交通大学;2011年
4 万会松;冰雹综合预报方法的研究[D];天津大学;2012年
5 周丽丽;学习表达式的映射机制研究[D];苏州大学;2011年
6 何文慧;李群深层结构学习算法研究[D];苏州大学;2011年
7 谈锐;半监督数据降维方法的研究[D];江南大学;2012年
8 任红旭;基于OSG的洪水演进可视化研究[D];郑州大学;2009年
9 蔡文婷;集成高光谱与声纳数据的浅水水下地形构建研究[D];南京大学;2012年
10 刘雅蓉;基于谱聚类的彩色图像分割算法研究[D];陕西师范大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 王靖;;基于鲁棒的全局流形学习方法[J];计算机工程;2008年09期
2 李子荣;杜明辉;;LDA/GE在人脸识别中的应用[J];计算机工程与应用;2008年25期
3 孟德宇;古楠楠;徐宗本;梁怡;;针对环状流形数据的非线性降维[J];软件学报;2008年11期
4 周谆;杨炳儒;;基于认知的流形学习方法概要[J];计算机科学;2009年05期
5 唐皓;刘希玉;;基于密度流形上的空间聚类[J];河北大学学报(自然科学版);2009年06期
6 邵超;张斌;万春红;;流形学习中邻域大小参数的合适性判定[J];计算机工程与应用;2010年20期
7 李昕;钱旭;王自强;;用于文档聚类的间隔流形学习算法研究[J];计算机工程;2010年15期
8 陈晓红;陈松灿;;监督型局部保持的典型相关分析[J];小型微型计算机系统;2010年08期
9 刘辉;杨俊安;王一;;基于流形学习的声目标特征提取方法研究[J];物理学报;2011年07期
10 詹德川,周志华;基于集成的流形学习可视化[J];计算机研究与发展;2005年09期
中国重要会议论文全文数据库 前10条
1 董广军;纪松;朱朝杰;;基于局部线性嵌入流形学习的高光谱影像分类技术[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
2 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
3 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
4 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
5 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
6 傅向华;王志强;赵良辉;杜文峰;;基于拉普拉斯流形正则化的半监督图像检索[A];第四届和谐人机环境联合学术会议论文集[C];2008年
7 宋欣;王娟;张斌;叶世伟;;流形学习算法分析及在人脸数据库上的应用[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
8 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
9 董冀媛;穆志纯;欧阳定恒;;基于最大线性片划分的局部切空间排列算法及在多姿态人耳识别中的应用[A];第二十九届中国控制会议论文集[C];2010年
10 曾九孙;郜传厚;罗世华;李启会;;基于增量LPP的在线过程监控方法及其应用[A];中国自动化学会控制理论专业委员会C卷[C];2011年
中国博士学位论文全文数据库 前10条
1 刘晓宁;基于三维模型的人脸识别技术研究[D];西北大学;2006年
2 王雷;基于全局统计与局部几何性质的数据降维算法研究[D];中国科学技术大学;2009年
3 王国强;嵌入邻域判别关系的子空间人脸识别算法研究[D];大连理工大学;2008年
4 金一;人脸识别中的若干算法研究[D];北京交通大学;2009年
5 李学华;基于核与软计算方法的模式分析[D];电子科技大学;2009年
6 杜春华;人脸特征点定位及识别的研究[D];上海交通大学;2008年
7 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
8 于雪莲;基于核方法和流形学习的雷达目标距离像识别研究[D];电子科技大学;2008年
9 舒文杰;RNA二级结构拓扑特征化关键技术及其应用研究[D];国防科学技术大学;2007年
10 田春娜;复杂背景下多视角人脸检测与识别[D];西安电子科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 周晓勇;流形学习算法研究与应用[D];安徽大学;2014年
2 李丽敏;自相交流形学习方法[D];浙江大学;2006年
3 贺惠新;基于流形学习的高维流场数据分类研究[D];哈尔滨工业大学;2008年
4 王添翼;基于卷积网络的三维模型特征提取[D];吉林大学;2006年
5 钟吉英;半监督学习算法在脑—计算机接口中的应用研究[D];电子科技大学;2009年
6 张炯;基于流形学习的纤维丛学习算法研究[D];苏州大学;2008年
7 郑守志;基于流形学习理论的空间信息源研究及应用[D];中国科学院研究生院(计算技术研究所);2006年
8 杨红敏;固有维数估计的研究与应用[D];天津大学;2007年
9 徐蓉;非特定人手语数据的流形结构分析与识别[D];哈尔滨工业大学;2007年
10 田文君;基于深度图像的三维人脸特征提取[D];北京交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026