收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

流形学习的谱方法相关问题研究

曾宪华  
【摘要】: 在当今这个信息时代,可以方便地获得大量的数据。许多实际应用中,获得的数据是高维的、庞大的、繁杂的、无序的,并且还在不断的增加,有价值的信息淹没在大规模的海量高维数据集之中,需要发现数据的内在规律以及预测未来发展趋势。流形学习就是假定这些观测数据位于或近似位于一个嵌入在高维欧氏空间中的内在低维流形上,主要目标是发现高维观测数据集的内在低维流形结构和嵌入映射关系。目前,流形学习已经成为机器学习、模式识别、数据挖掘以及其它相关研究领域的研究热点。 本文通过分析流形学习的内涵与外延,立足于解决流形学习的谱方法中的重要问题,在算法设计层面和图像流形应用层面上展开了一系列研究。首先对流形学习的典型谱方法做了详细对比分析,然后针对流形的增殖学习、构造近邻关系的合理度量、提高内在低维空间的可分性、基于集成的流形学习、局部保持的算法和全局保持的算法两者优势融合等几方面进行了重点研究,提出了五个以谱方法为基础的流形学习算法,并和相关研究成果做了理论上与实验上的比较,表明了我们提出算法的有效性。 本文主要创新成果有以下几方面: (1)定义了增殖流形学习的概念,这有利于指导符合人脑增殖学习机理的流形学习算法的研究。以此为指导原则,提出了一种基于LLE的动态增殖流形学习算法(DKI-LLE)。实验结果表明:DKI-LLE算法比LLE的几个增量式算法在处理新数据集时有更好的效果;DKI-LLE算法发现的整体低维结构更接近批处理的方式获得的低维结构,使得新到来的数据子集所包含的低维结构知识被整合到原有的低维结构中去;而LLE的增量式算法处理新的观测数据时更依赖于原有数据的低维坐标。 (2)提出了一种基于测地线距离的广义高斯型拉普拉斯特征映射算法(GGLE)。该算法将测地线距离和广义高斯函数融合到传统的拉普拉斯特征映射算法中,可以调整近邻图结点间的相似度,通过选择超高斯、高斯或者次高斯函数来实现不同程度的近邻局部特性的保持;而且当需要保持更多的近邻关系使得数据点邻域增大时,采用测地线距离可以避免欧氏距离度量不合理的缺陷;实验结果表明在用不同的广义高斯函数度量高维数据点间的相似度时,局部近邻结构保持的程度是不同的,GGLE获得的全局低维坐标也呈现出不同的聚类特性。 (3)提出了一种基于GGLE的集成判别算法(EGGLE),该算法的主要优点是:近邻参数k固定,邻接矩阵和测地线距离矩阵都只构造一次,只需要多次选择广义高斯型函数构造多个拉普拉斯矩阵,获取多个独立的低维空间坐标集合,独立学习分类器,集成分类识别。时间复杂度上EGGLE算法与Ensemble-Isomap和En-ULLELDA算法相比较通常更具有优越性。在半监督学习框架下做了LE与EGGLE算法的对比实验,识别结果表明了EGGLE算法的有效性。另外,本文也提出了一种监督的集成流形学习算法(EGGLE-LDA),该算法将线性监督算法LDA和EGGLE相结合,加强集成流形学习在监督学习中的判别能力,使得EGGLE-LDA算法既考虑了数据的类别信息又考虑了几何分布特性。实验结果表明了EGGLE-LDA算法和En-ULLELDA算法的集成识别性能的差异。 (4)提出了一种全局拉普拉斯展开算法(GLU),该算法综合了局部保持的拉普拉斯特征映射算法(LE)和全局保持的最大化方差展开算法(MVU)的优点。主要思想是使得局部近邻的点尽可能的接近,同时也要使得相互远离点尽可能远。实现方法是构造局部尽可能近邻和全局展开的双目标函数,引入低维坐标的Gram内积矩阵,通过半定规划(SDP)的方法优化双目标函数,从而学习这样一个内积矩阵,最后对这个内积矩阵进行特征分解求内在低维嵌入。在月亮形人造数据集、真实的USPS手写体数字数据集和雕塑头像数据集上的可视化实验验证了GLU算法的有效性;并且比较了LE、MVU、UDP和GLU等4种流形学习算法的低维可分性和可视化效果,实验结果表明了GLU算法的优越性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 周波;;两种基于谱方法的流形学习算法研究[J];云南民族大学学报(自然科学版);2008年04期
2 李子荣;杜明辉;;基于局部边界鉴别分析的人脸识别[J];电子与信息学报;2009年03期
3 魏莱;王守觉;徐菲菲;;一种对奇异值不敏感的ISOMAP[J];计算机应用;2007年08期
4 李子荣;杜明辉;;LDA/GE在人脸识别中的应用[J];计算机工程与应用;2008年25期
5 王志强;傅向华;赵良辉;杜文峰;;基于内容的半监督流形图像检索[J];武汉大学学报(信息科学版);2009年08期
6 贺广南;杨育彬;;基于流形学习的图像检索算法研究[J];山东大学学报(工学版);2010年05期
7 李勇;李应;余清清;;基于流形学习和SVM的环境声音分类[J];计算机工程;2011年07期
8 赵志凯;钱建生;程健;李小斌;;基于流形正则化的多元时间序列半监督回归[J];中国矿业大学学报;2011年03期
9 张振原;路红;;一种基于视频结构的场景分割方法[J];中国图象图形学报;2007年10期
10 王广斌;刘义伦;黄良沛;;正交迭代局部Fisher判别转子故障诊断[J];振动.测试与诊断;2010年05期
11 宋欣;叶世伟;;基于直接估计梯度思想的数据降维算法[J];计算机工程;2008年08期
12 王自强;钱旭;孔敏;;流形学习算法综述[J];计算机工程与应用;2008年35期
13 王泽杰;胡浩民;;流形学习算法中的参数选择问题研究[J];计算机应用与软件;2010年06期
14 林立,王继成,魏朝阳,段晓宇;防伪税控系统与安钢销售网络的集成与应用[J];河南冶金;2001年06期
15 陈征,叶元平;Net Ware与Windows NT并存教学网络方案的探讨[J];实验技术与管理;2001年02期
16 刘深渊;网上项目管理和协同工作系统初探[J];建设监理;2002年04期
17 韩志刚,钱乐祥,秦奋,崔彩辉;数字城市集成建设的探讨[J];地理与地理信息科学;2003年06期
18 赵鸣,吴晓红;CORBA在异构数据库集成上的应用研究[J];现代电子技术;2003年20期
19 李生琦,徐福缘,徐莹;一种结构化数据和半结构化数据的统一集成模型[J];计算机工程与应用;2004年15期
20 赵虎,李萍,于林丽,孟丽霞,濮育麒,居滋培;过程控制集成实验系统[J];仪器仪表学报;2005年S2期
中国重要会议论文全文数据库 前10条
1 赵方;谢友柏;柏子游;;油液分析多技术集成的特征描述与信息融合[A];第六届全国摩擦学学术会议论文集(上册)[C];1997年
2 岳瑞峰;刘理天;李志坚;;集成MOS力敏运放压力传感器的设计与研究[A];2000全国力学量传感器及测试、计量学术交流会论文集[C];2000年
3 刘彭涛;李志新;;首钢大型转炉技术装备的集成创新[A];第七届(2009)中国钢铁年会论文集(下)[C];2009年
4 嵇晓宇;郝志明;莫军;孙乐;王柯颖;;面向对象有限元分析平台数值解法器构件化设计与集成方法研究[A];中国力学学会学术大会'2009论文摘要集[C];2009年
5 吴泽兵;;石油钻头并行工程中仿真软件的集成[A];2001系统仿真技术及其应用学术会议论文集[C];2001年
6 王鹏程;王珂;朱宝泉;;注塑模CAD/CAM与CAE系统的集成[A];2000年冀晋蒙豫鲁鄂六省区机械工程学会学术研讨会论文集(内蒙古部分)[C];2000年
7 赵虎;李萍;于林丽;孟丽霞;濮育麒;居滋培;;过程控制集成实验系统[A];第七届青年学术会议论文集[C];2005年
8 文强;邹希云;莫松柏;杨晓琳;刘电英;彭杰彪;;利用T213和ECMWF数值预报产品作本地暴雨落区概率预报[A];中国气象学会2007年年会天气预报预警和影响评估技术分会场论文集[C];2007年
9 冯柳平;刘华群;;数字指纹在电子文档保护中的应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 冯志强;何力健;;茂名分公司炼油生产执行系统集成需求探讨[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
中国博士学位论文全文数据库 前10条
1 曾宪华;流形学习的谱方法相关问题研究[D];北京交通大学;2009年
2 刘飞;谱方法与高阶时间离散方法及应用[D];浙江大学;2012年
3 刘红卫;半定规划及其应用[D];西安电子科技大学;2002年
4 孙明明;流形学习理论与算法研究[D];南京理工大学;2007年
5 徐翔;谱方法在一类数学物理反问题中的应用[D];复旦大学;2010年
6 赵凌潇;基于流形的半监督分类方法研究[D];浙江大学;2009年
7 张璟;无穷域问题的谱方法研究[D];上海大学;2003年
8 孔敏;关联图的谱分析及谱聚类方法研究[D];安徽大学;2006年
9 唐跃中;数字化电网若干关键技术研究[D];浙江大学;2010年
10 周建伟;状态受限最优控制问题的谱方法[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 兰睿欣;基于PDM/ERP集成的制造业信息系统研究[D];四川大学;2005年
2 邓严;基于VRML的远程监控技术研究[D];华中科技大学;2005年
3 陶海冰;GIS平台下的滑坡中抗滑桩一体化设计[D];浙江工业大学;2005年
4 陈志武;基于Web Services的人才市场异构信息系统集成的研究[D];郑州大学;2005年
5 葛晓燕;基于代理的P2P网络访问Web服务的研究与实现[D];新疆大学;2005年
6 马小方;构筑于AIS-ECDIS技术集成的海上安全信息系统的设计与实现[D];上海海事大学;2004年
7 陈弦;基于组件的异构数据集成与转换系统的研究与实现[D];中南大学;2005年
8 廖世智;GIS与二维水流泥沙数学模型的集成及可视化研究[D];天津大学;2004年
9 陈乐;数字化仿真实验集成平台及其关键技术研究[D];西北工业大学;2006年
10 周娜;基于Web Services的防震减灾信息系统集成技术的研究[D];中国地震局地质研究所;2005年
中国重要报纸全文数据库 前10条
1 记者 钱秀丽;今年全力以赴做好五项重点工作[N];中国海洋报;2010年
2 记者 朱夕子;商业规划师何雨生日本设计师小川浩史加盟集成[N];中国纺织报;2009年
3 安向琦 赵鲜娜;从“孤岛”走向集成[N];中国航空报;2010年
4 本报记者 宋斌斌;研发设计信息化:新时期工业企业创新的源泉[N];中国工业报;2009年
5 证券时报记者 黄婷;宝钢股份自主集成冷轧产线在梅钢投产[N];证券时报;2009年
6 见习记者 石俊;成飞集成缘何成为“第一妖股”[N];中华工商时报;2010年
7 本报记者 同黎娜;集成控股收购日本设计公司始末[N];中国服饰报;2009年
8 ;在MCU中集成模拟和安全技术[N];中国电子报;2009年
9 吴绵;以顾客为中心森歌巡检集成灶[N];中国质量报;2009年
10 本报记者 林铭铭;成飞集成暴涨:讲不完的“锂电”故事?[N];21世纪经济报道;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978