收藏本站
《国防科学技术大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于流形学习的分类与聚类方法及其应用研究

王勇  
【摘要】:信息技术和互联网的飞速发展,使得从多个数据源得到的多种形态的数据不断地成指数级爆炸。如何对这些海量的复杂高维数据进行快速有效的处理、提取用户所需要的有价值信息是理论与应用数学、模式识别和计算机视觉等领域的研究者们所共同关注的问题。流形学习是一种有效的数据处理工具,可以从原始高维数据中挖掘有效精简的信息并发现数据的低维本质属性,为实现“不分时间和地域,可以有效地利用数据和信息”提供了解决思路。本文以模式分类和聚类分析两个问题为背景,从流形学习的角度研究了新型高效的维数约简算法、数据内蕴结构挖掘以及混合流形聚类问题,从理论、方法和应用三个层面对流形学习的相关问题进行了深入研究和拓展。具体而言,本文的主要贡献如下: 1.拓展了传统流形学习方法在高维小采样情况下的相关理论,探讨了图像矩阵型数据表示下的学习和拓展问题。针对NPE方法在高维小采样情况下存在的广义特征分析的奇异矩阵问题以及解的不稳健性和不完备性,提出矩阵分析方法CNPE,在不显著增加算法复杂度、不损失有用信息的情况下拓展了相关理论。另一方面,针对人脸识别中图像数据固有的矩阵型结构特性和相互关联,以及向量化转化带来的高维向量空间和数据自身空间结构信息的丧失,探讨了直接在矩阵型数据表示下的学习能力和拓展问题。 2.提出了基于多流形假设的内蕴结构模型及其指导下的内蕴判别分析方法IDA。针对模式分类任务中多流形假设下的数学建模问题,建立了多流形内蕴结构模型,通过数学模型对数据进行划分、具体表示数据的内蕴特性和结构关系,并在该模型的指导下提出了IDA方法。内蕴结构模型应用于人脸识别时,得到了第一个完全基于数学表示而非概念性表示的内蕴人脸模型。另一方面,从数据分解的角度对经典的维数约简方法PCA和LDA进行了解释,拓展了对经典方法的理解和认识。 3.细致分析了线性流形聚类方法K-flats在仿射子空间下性能退化的原因,提出了局部K-flats方法来改进聚类性能并搭建了线性与非线性流形聚类方法之间联系的桥梁。本文通过细致分析揭示了K-flats性能退化的原因:点到流形距离的重构误差准则和线性模型的无限延伸性造成三类误差:固有误差、无限延伸误差和共线性误差。然后,我们提出了一种能让线性模型具有局部表示能力的新的误差准则和局部K-flats方法来改进原始方法的性能并自然地处理非线性结构数据,不仅将基于模型和基于相似性的线性流形聚类方法联系了起来,更在线性和非线性流形聚类方法之间建立了桥梁。 4.首次明确地提出了流形聚类的一般框架-混合流形聚类问题并分析了其难点及可行的解决途径。我们在学术界首次明确地提出了混合流形聚类问题,将对流形聚类的研究推向一个更一般更广泛的框架:数据中既包含线性结构又包含非线性结构、既有良分离的结构又有相互交叠的结构,从而涵盖了现有流形聚类研究的所有方面。我们通过深入探讨,分析出其难点在于如何描述或表示数据及其相互之间的关系,如何将流形交叉处的点拆解开来得到不同流形结构的成分;并进而提出了该问题可行的解决途径:可以通过考察数据的局部特性和充分利用流形数据所内含的几何结构关系来解决混合流形聚类问题。 5.深入考察了谱方法用于混合流形聚类的潜力,并从不同的角度提出了三种有效的方法来解决混合流形聚类问题。受谱聚类方法优良特性和广泛应用的启发,我们分别深入考察了非对称型规范化谱聚类和对称型规范化谱聚类用于混合流形聚类的潜力。然后,从三个不同的角度出发,即近邻图构造、相似性矩阵构造和近邻点选取,提出了三种基于谱方法的流形聚类方法来分组数据中的低维混合流形结构,从而有效地解决了混合流形聚类问题。 总之,本文在完善和推动流形学习方法的理论研究的同时,将理论研究成果应用于解决模式分类和聚类分析中的实际问题,特别是在基于多流形假设的数据建模与应用方面做了一些有意义和价值的探索与尝试。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP391.41;O186.12

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前4条
1 雷小培;基于仿射传播聚类算法的改进研究[D];西北大学;2012年
2 王闯;基于局部线性嵌入的多模式工业过程监测方法研究[D];东北大学;2013年
3 高寅;快速粒子滤波研究[D];江苏科技大学;2013年
4 肖良;基于稀疏表示的数据分类与聚类算法及其应用研究[D];国防科学技术大学;2012年
【参考文献】
中国期刊全文数据库 前3条
1 谭璐,吴翊,易东云;稳健局部线性嵌入方法[J];国防科技大学学报;2004年06期
2 张振跃,查宏远;线性低秩逼近与非线性降维[J];中国科学(A辑:数学);2005年03期
3 尹峻松;肖健;周宗潭;胡德文;;非线性流形学习方法的分析与应用[J];自然科学进展;2007年08期
中国博士学位论文全文数据库 前1条
1 谭璐;高维数据的降维理论及应用[D];国防科学技术大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 李德禄;李群R~3|×GL(3)的Maurer-Cartan形式的两种证明[J];安阳师范学院学报;2005年05期
2 秦洋;王立宏;武栓虎;宋宜斌;;基于拉普拉斯矩阵的DNA序列集相似性分析[J];北京交通大学学报;2009年06期
3 贺仁亚,程乾生,孙喜晨;属性均值聚类二叉树及其在人脸识别中的应用[J];北京大学学报(自然科学版);2002年05期
4 赵艳厂,谢帆,宋俊德;一种新的聚类算法:等密度线算法[J];北京邮电大学学报;2002年02期
5 李春霞;刘汉泽;;基于微分的向量函数的几何性质[J];滨州学院学报;2008年06期
6 许传亮;唐晓春;;3阶张量的最佳秩-r逼近[J];滨州学院学报;2009年06期
7 秦华军;高朝邦;;广义Kronecker-δ符号在张量计算中的应用[J];成都大学学报(自然科学版);2007年03期
8 王松桂,杨虎;统计学中的若干矩阵研究[J];重庆交通学院学报;1993年03期
9 赵继东;鲁珂;吴跃;;保局投影算法的优化研究[J];电子科技大学学报;2008年05期
10 吴德林;;用于两相流电容层析成像系统中的图像重建算法[J];电脑知识与技术;2009年31期
中国重要会议论文全文数据库 前3条
1 董冀媛;穆志纯;欧阳定恒;;基于最大线性片划分的局部切空间排列算法及在多姿态人耳识别中的应用[A];第二十九届中国控制会议论文集[C];2010年
2 周志勇;邓世为;杨立坤;;基于POD技术对大跨度桥梁颤振机理的探讨[A];第十四届全国结构风工程学术会议论文集(上册)[C];2009年
3 王小磊;张瑾;许洪波;;基于交互增强原理的多文档自动文摘算法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 贲晛烨;基于人体运动分析的步态识别算法研究[D];哈尔滨工程大学;2010年
2 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
3 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
4 宋军;水交换模型的理论方法及应用研究[D];中国海洋大学;2010年
5 包兴先;基于模型定阶和信号消噪的海洋平台结构模态参数识别研究[D];中国海洋大学;2010年
6 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
7 邵纪东;非线性过程监测中的数据降维及相关问题研究[D];浙江大学;2010年
8 符茂胜;局部保持的流形学习理论及其在视觉信息分析中的应用[D];安徽大学;2010年
9 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
10 许相莉;基于智能计算的图像检索算法研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 李永刚;单位球面中两类超曲面的Moebius等价性[D];郑州大学;2010年
2 李静伟;基于共享近邻的自适应谱聚类算法[D];大连理工大学;2010年
3 杜慧;张量和小波特征的洛伦兹度量学习及其应用[D];大连理工大学;2010年
4 唐科威;基于洛伦兹流形的特征提取算法研究[D];大连理工大学;2010年
5 孙玉侠;数据挖掘中的谱聚类算法研究[D];中国海洋大学;2010年
6 温焕明;局部对称空间中具有平行平均曲率向量的子流形[D];江西师范大学;2010年
7 李飞;稀疏过完备混合信号盲分离的研究[D];南昌大学;2010年
8 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
9 李涛;某些特殊凸区域的平均弦长[D];武汉科技大学;2010年
10 毛菥;基于文本分析技术的新闻阅读平台的研究与实现[D];浙江大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 王慧;申石磊;;基于改进的K均值聚类彩色图像分割方法[J];电脑知识与技术;2010年04期
2 石光明;刘丹华;高大化;刘哲;林杰;王良君;;压缩感知理论及其研究进展[J];电子学报;2009年05期
3 董俊;王锁萍;熊范纶;;可变相似性度量的近邻传播聚类[J];电子与信息学报;2010年03期
4 王丽;侍洪波;;基于核独立元分析的间歇过程在线监控[J];化工学报;2010年05期
5 陈玉东,施颂椒,翁正新;动态系统的故障诊断方法综述[J];化工自动化及仪表;2001年03期
6 邓小龙;谢剑英;郭为忠;;用于状态估计的自适应粒子滤波[J];华南理工大学学报(自然科学版);2006年01期
7 胡峰,孙国基;过程监控与容错处理的现状及展望[J];测控技术;1999年12期
8 赵媛媛;叶亮;郭雷;;粒子数和采样周期自适应的粒子滤波器[J];计算机工程与应用;2006年12期
9 崔平远;郑黎方;裴福俊;;基于自调整粒子滤波的组合导航方法研究[J];计算机工程;2008年14期
10 张亮;杜子平;张俊;李杨;;基于拉普拉斯特征映射的仿射传播聚类[J];计算机工程;2011年09期
中国博士学位论文全文数据库 前4条
1 杨金宝;基于灰度相似性测度的医学图像配准技术研究[D];山东大学;2008年
2 葛志强;复杂工况过程统计监测方法研究[D];浙江大学;2009年
3 李珊珊;计算机视觉中特征与相似性度量研究[D];中国科学技术大学;2010年
4 唐东明;聚类分析及其应用研究[D];电子科技大学;2010年
中国硕士学位论文全文数据库 前1条
1 张绪青;基于图模型的聚类算法研究[D];浙江大学;2008年
【二级参考文献】
中国期刊全文数据库 前7条
1 谭璐,吴翊,刘卓;高维图像数据的最优表达[J];国防科技大学学报;2003年05期
2 谭璐,吴翊,易东云;稳健局部线性嵌入方法[J];国防科技大学学报;2004年06期
3 谭璐,易东云,吴翊,袁伟;基于非线性降维的图像识别[J];计算机工程;2005年13期
4 谭璐,吴翊;局部规则嵌入[J];计算机应用;2005年04期
5 宋健;高维函数和流形在低维可视空间中的最优表达[J];科学通报;2001年12期
6 谭璐,朱矩波,吴翊;基于最优一维分解的图像超分辨方法[J];中国图象图形学报;2004年04期
7 谭璐,易东云,冯国柱,吴翊;局部不变投影[J];自然科学进展;2004年03期
【相似文献】
中国期刊全文数据库 前10条
1 魏莱;王守觉;徐菲菲;;一种对奇异值不敏感的ISOMAP[J];计算机应用;2007年08期
2 王靖;;基于鲁棒的全局流形学习方法[J];计算机工程;2008年09期
3 李子荣;杜明辉;;LDA/GE在人脸识别中的应用[J];计算机工程与应用;2008年25期
4 孟德宇;古楠楠;徐宗本;梁怡;;针对环状流形数据的非线性降维[J];软件学报;2008年11期
5 周谆;杨炳儒;;基于认知的流形学习方法概要[J];计算机科学;2009年05期
6 唐皓;刘希玉;;基于密度流形上的空间聚类[J];河北大学学报(自然科学版);2009年06期
7 邵超;张斌;万春红;;流形学习中邻域大小参数的合适性判定[J];计算机工程与应用;2010年20期
8 李昕;钱旭;王自强;;用于文档聚类的间隔流形学习算法研究[J];计算机工程;2010年15期
9 陈晓红;陈松灿;;监督型局部保持的典型相关分析[J];小型微型计算机系统;2010年08期
10 刘辉;杨俊安;王一;;基于流形学习的声目标特征提取方法研究[J];物理学报;2011年07期
中国重要会议论文全文数据库 前10条
1 董广军;纪松;朱朝杰;;基于局部线性嵌入流形学习的高光谱影像分类技术[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
2 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
3 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
4 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
5 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
6 傅向华;王志强;赵良辉;杜文峰;;基于拉普拉斯流形正则化的半监督图像检索[A];第四届和谐人机环境联合学术会议论文集[C];2008年
7 宋欣;王娟;张斌;叶世伟;;流形学习算法分析及在人脸数据库上的应用[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
8 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
9 董冀媛;穆志纯;欧阳定恒;;基于最大线性片划分的局部切空间排列算法及在多姿态人耳识别中的应用[A];第二十九届中国控制会议论文集[C];2010年
10 曾九孙;郜传厚;罗世华;李启会;;基于增量LPP的在线过程监控方法及其应用[A];中国自动化学会控制理论专业委员会C卷[C];2011年
中国博士学位论文全文数据库 前10条
1 刘晓宁;基于三维模型的人脸识别技术研究[D];西北大学;2006年
2 王雷;基于全局统计与局部几何性质的数据降维算法研究[D];中国科学技术大学;2009年
3 王国强;嵌入邻域判别关系的子空间人脸识别算法研究[D];大连理工大学;2008年
4 金一;人脸识别中的若干算法研究[D];北京交通大学;2009年
5 李学华;基于核与软计算方法的模式分析[D];电子科技大学;2009年
6 杜春华;人脸特征点定位及识别的研究[D];上海交通大学;2008年
7 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
8 于雪莲;基于核方法和流形学习的雷达目标距离像识别研究[D];电子科技大学;2008年
9 舒文杰;RNA二级结构拓扑特征化关键技术及其应用研究[D];国防科学技术大学;2007年
10 田春娜;复杂背景下多视角人脸检测与识别[D];西安电子科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 黄运娟;等谱流形学习算法及其应用研究[D];苏州大学;2014年
2 周晓勇;流形学习算法研究与应用[D];安徽大学;2014年
3 陈磊;基于线性子空间与流形学习的人脸识别算法研究[D];西安电子科技大学;2014年
4 丁娇;基于流形学习算法的植物叶片图像识别方法研究[D];安徽大学;2014年
5 裴书芳;基于流形学习的无线传感器网络入侵检测方法研究[D];河北师范大学;2014年
6 李丽敏;自相交流形学习方法[D];浙江大学;2006年
7 贺惠新;基于流形学习的高维流场数据分类研究[D];哈尔滨工业大学;2008年
8 王添翼;基于卷积网络的三维模型特征提取[D];吉林大学;2006年
9 钟吉英;半监督学习算法在脑—计算机接口中的应用研究[D];电子科技大学;2009年
10 张炯;基于流形学习的纤维丛学习算法研究[D];苏州大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026