收藏本站
《中国科学技术大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

流形学习算法及其应用研究

雷迎科  
【摘要】:流形学习方法作为一类新兴的非线性维数约简方法,主要目标是获取高维观测数据的低维紧致表示,探索事物的内在规律和本征结构,已经成为数据挖掘、模式识别和机器学习等领域的研究热点。流形学习方法的非线性本质、几何直观性和计算可行性,使得它在许多标准的toy数据集和实际数据集上都取得了令人满意的结果,然而它们本身还存在着一些普遍性的问题,比如泛化学习问题、监督学习问题和大规模流形学习问题等。因此,本文从流形学习方法存在的问题出发,在算法设计和应用(图像数据与蛋白质相互作用数据)等方面展开了一系列研究工作。首先对流形学习的典型方法做了详细对比分析,然后针对流形的泛化学习和监督学习、表征流形的局部几何结构、构造全局的正则化线性回归模型、大规模数据的流形学习等几个方面进行了重点研究,提出了三种有效的流形学习算法,并和相关研究成果进行了理论与实验上的比较,从而验证了我们所提算法的有效性。 全文的主要工作概括如下: (1)在深入研究局部样条嵌入算法(LSE)的基础上,引入明确的线性映射关系,构建平移缩放模型和正交化特征子空间,提出了一种正交局部样条判别投影算法(O-LSDP)。有效解决了原始LSE算法存在的两个主要问题:样本外点学习问题和无监督模式学习问题,从而使该算法能够应用于模式分类问题并显著改善了算法的分类识别能力。在标准人脸数据库上进行实验比较分析,验证了该算法的有效性与可行性。 (2)在兼容映射的概念框架下,提出了一种局部多尺度回归嵌入算法(LMDSRE)。LMDSRE算法首先利用局部多维尺度分析(LMDS)构建每个样本点邻域的局部坐标来表示低维流形的局部几何结构,然后拟合正则化的线性回归模型并排列所有的局部等距坐标,从而构建全局唯一的低维坐标。该算法作为一种新的流形学习方法具有局部等距的特点,能够应用于非线性维数约简和数据可视化分析,在六个标准人工数据集和三个实际数据集上的实验结果验证了该方法的有效性。 (3)针对ISOMAP算法计算复杂度高的问题,提出了一种快速等距特征映射算法(Fast-ISOMAP)。Fast-ISOMAP算法首先利用最小子集覆盖策略(MSC)从数据集中选择p个Landmark点( p n),从而在构造最短路径距离矩阵时,用p×n距离矩阵D p×n代替了原始的n×n距离矩阵Dn×n,然后运用Landmark MDS算法将所有样本嵌入到低维特征空间。与原始的ISOMAP算法相比,Fast-ISOMAP算法在不显著改变原始ISOMAP算法嵌入性能的条件下,大大提高了算法的计算效率,该算法适合应用于大规模流形学习问题。在标准数据集上的实验结果验证了该算法的有效性。 (4)提出了一种鲁棒的基于快速流形嵌入的蛋白质相互作用数据可信度评估与预测新方法。首先通过对蛋白质相互作用数据进行低维流形建模,然后采用快速等距特征映射流形学习方法将蛋白质相互作用数据映射到低维度量空间,从而把蛋白质相互作用数据可信度评估与预测的生物问题转化为低维嵌入空间中数据点之间相似性度量的数学问题,最后根据蛋白质对在低维嵌入空间的相似性度量来构造加权CD-Dist可靠性指数用于评估与预测可信度。在三个由不同高通量实验技术产生的不同规模的酵母蛋白质相互作用数据集上的实验结果表明,基于快速流形嵌入的方法所获得的高可靠性相互作用数据具有更高的功能一致性与细胞组分一致性。据我们所知,本章所提出的方法首次利用了流形学习理论来解决蛋白质相互作用数据可信度的评估与预测问题。该方法有效克服了现有方法需要额外先验信息和对蛋白质相互作用网络稀疏程度敏感的问题,为检测蛋白质相互作用网络中的假阳性与假阴性“噪声”问题提供了一条新的解决途径。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 魏莱;王守觉;徐菲菲;;一种对奇异值不敏感的ISOMAP[J];计算机应用;2007年08期
2 王靖;;基于鲁棒的全局流形学习方法[J];计算机工程;2008年09期
3 李子荣;杜明辉;;LDA/GE在人脸识别中的应用[J];计算机工程与应用;2008年25期
4 孟德宇;古楠楠;徐宗本;梁怡;;针对环状流形数据的非线性降维[J];软件学报;2008年11期
5 周谆;杨炳儒;;基于认知的流形学习方法概要[J];计算机科学;2009年05期
6 唐皓;刘希玉;;基于密度流形上的空间聚类[J];河北大学学报(自然科学版);2009年06期
7 邵超;张斌;万春红;;流形学习中邻域大小参数的合适性判定[J];计算机工程与应用;2010年20期
8 李昕;钱旭;王自强;;用于文档聚类的间隔流形学习算法研究[J];计算机工程;2010年15期
9 陈晓红;陈松灿;;监督型局部保持的典型相关分析[J];小型微型计算机系统;2010年08期
10 刘辉;杨俊安;王一;;基于流形学习的声目标特征提取方法研究[J];物理学报;2011年07期
11 詹德川,周志华;基于集成的流形学习可视化[J];计算机研究与发展;2005年09期
12 万海平;何华灿;;一个关于如何选择核函数的框架(英文)[J];广西师范大学学报(自然科学版);2006年04期
13 祝磊;朱善安;;基于2维保局投影的人脸识别[J];中国图象图形学报;2007年11期
14 喻军;申家峰;;有监督的核局部线性嵌入算法[J];科学技术与工程;2008年14期
15 冯海亮;李见为;黄鸿;;自组织LLE算法及其在人脸识别中的应用[J];光学精密工程;2008年09期
16 王靖;;基于离群点检测的鲁棒局部切空间排列方法[J];华侨大学学报(自然科学版);2008年04期
17 李子荣;杜明辉;;基于局部边界鉴别分析的人脸识别[J];电子与信息学报;2009年03期
18 蔡洪;何强;韩壮志;尚朝轩;;基于局部保持判别子空间的ISAR目标识别[J];中国电子科学研究院学报;2009年06期
19 贺广南;杨育彬;;基于流形学习的图像检索算法研究[J];山东大学学报(工学版);2010年05期
20 张善文;巨春飞;;正交全局-局部判别映射应用于植物叶片分类[J];农业工程学报;2010年10期
中国重要会议论文全文数据库 前10条
1 董广军;纪松;朱朝杰;;基于局部线性嵌入流形学习的高光谱影像分类技术[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
2 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
3 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
4 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
5 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
6 傅向华;王志强;赵良辉;杜文峰;;基于拉普拉斯流形正则化的半监督图像检索[A];第四届和谐人机环境联合学术会议论文集[C];2008年
7 宋欣;王娟;张斌;叶世伟;;流形学习算法分析及在人脸数据库上的应用[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
8 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
9 董冀媛;穆志纯;欧阳定恒;;基于最大线性片划分的局部切空间排列算法及在多姿态人耳识别中的应用[A];第二十九届中国控制会议论文集[C];2010年
10 曾九孙;郜传厚;罗世华;李启会;;基于增量LPP的在线过程监控方法及其应用[A];中国自动化学会控制理论专业委员会C卷[C];2011年
中国博士学位论文全文数据库 前10条
1 刘晓宁;基于三维模型的人脸识别技术研究[D];西北大学;2006年
2 王雷;基于全局统计与局部几何性质的数据降维算法研究[D];中国科学技术大学;2009年
3 王国强;嵌入邻域判别关系的子空间人脸识别算法研究[D];大连理工大学;2008年
4 金一;人脸识别中的若干算法研究[D];北京交通大学;2009年
5 李学华;基于核与软计算方法的模式分析[D];电子科技大学;2009年
6 杜春华;人脸特征点定位及识别的研究[D];上海交通大学;2008年
7 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
8 于雪莲;基于核方法和流形学习的雷达目标距离像识别研究[D];电子科技大学;2008年
9 舒文杰;RNA二级结构拓扑特征化关键技术及其应用研究[D];国防科学技术大学;2007年
10 田春娜;复杂背景下多视角人脸检测与识别[D];西安电子科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 黄运娟;等谱流形学习算法及其应用研究[D];苏州大学;2014年
2 周晓勇;流形学习算法研究与应用[D];安徽大学;2014年
3 陈磊;基于线性子空间与流形学习的人脸识别算法研究[D];西安电子科技大学;2014年
4 丁娇;基于流形学习算法的植物叶片图像识别方法研究[D];安徽大学;2014年
5 裴书芳;基于流形学习的无线传感器网络入侵检测方法研究[D];河北师范大学;2014年
6 李丽敏;自相交流形学习方法[D];浙江大学;2006年
7 贺惠新;基于流形学习的高维流场数据分类研究[D];哈尔滨工业大学;2008年
8 王添翼;基于卷积网络的三维模型特征提取[D];吉林大学;2006年
9 钟吉英;半监督学习算法在脑—计算机接口中的应用研究[D];电子科技大学;2009年
10 张炯;基于流形学习的纤维丛学习算法研究[D];苏州大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978