收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于多元t分布的概率主成分分析及其应用

赵建华  
【摘要】: 主成分分析(PCA)是一种常用的降维技巧,在图像处理、模式识别以及数据挖掘中 都有很广泛的应用。但是,作为一种全局线性投影,经典的PCA用于实际中经常出现 的非线性数据时不可能令人满意。于是,近年来人们提出了各种各样的非线性PCA及 混合PCA.其中,特别重要的是由[39,40] 提出的概率PCA(本文称为Gaussian-PPCA). 在此学位论文中,我们将Gaussian-PPCA推广为基于多元t分布的概率PCA(下文称为t- PPCA),从而得到了一类无论在理论上还是在实际应用中均具有较大意义的通用数据降 维算法。具体说来,我们的主要工作包含以下内容: 理论方面:假设数据来自m个d元t分布的混合;而每个混合成分均满足迷向(iso- tropic)因子分析模型见§3. 2. 1) 。在第三、四两章,我们用EM型算法导出了模 型参数的极大似然估计。在此基础上,我们得到了一类新的数据投影及其重构 的算法,即,t-PPCA.当t分布的自由度ν=∞时,t-PPCA就是Gaussian-PPCA, 当m=1时,t-PPCA定义的数据投影的确来自某个矩阵S’的主成分分解(见§3. 1) ; 但只有在ν=∞时,S’才退化为样本协方差矩阵S.这说明经典主成分分析仅适用 于来自正态分布的数据。 应用方面:我们用多元t分布的有限混合作为数据模型,保证了t-PPCA的稳健 性,从而比Gaussian-PPCA更具实用价值。这在第五章的应用研究中得到了充分 的证明。在§5. 1的手写英文字母识别的实验中,结果表明t-PPCA的错误率大大小 于使用Gaussian-PPCA的错误率(见表5. 1) 。同时,我们发现数据投影对于某 些分类是必须的。这一现象有待于进一步的研究。在§5. 2的图像压缩实验中,我 们的图象重构质量明显优于使用Gaussian-PPCA的图象重构质量(比较图5. 2及图 5. 3) 。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王娟;;t分布密度函数之性质[J];淮阴工学院学报;2007年05期
2 刘智敏;统计t分布的新计算与应用[J];中国计量学院学报;2004年01期
3 杨欢欢;傅少川;;基于PCA的物流客户服务水平衡量与制定方法[J];物流技术;2009年07期
4 张运陶;肖盛兰;;硫化氢系统分析与阳离子结构关系的研究[J];西华师范大学学报(自然科学版);1989年04期
5 李新运,张海峰;主成分分析在山东省经济发展梯度分区中的应用[J];地域研究与开发;1995年01期
6 任玉林,邴春亭,逯家辉,郭晔;近红外漫反射光谱的主成分分析[J];光谱学与光谱分析;1996年06期
7 邹艳芬;主成分分析在经济评价中的应用[J];连云港化工高等专科学校学报;1996年04期
8 殷彩霞,彭莉,周纪勤,陆树刚,潘晓露,李聪;用主成分分析云南菊科植物微量元素特征[J];云南大学学报(自然科学版);1998年S3期
9 李昌爱,顾也萍;主成分分析和回归分析在水稻土质量评价中的应用——以桐城市为例[J];安徽师范大学学报(自然科学版);2001年04期
10 陈肇泰;测量结果的最佳估计及误差限[J];青岛教育学院学报;2001年03期
11 赵丽萍,徐维军;综合评价指标的选择方法及实证分析[J];宁夏大学学报(自然科学版);2002年02期
12 金皓,王倩;高血压病的风险因素分析与研究[J];应用数学与计算数学学报;2002年02期
13 施正可,涂三勤;VaR模型在我国证券市场的实证分析——基于t分布的RiskMetrics法[J];开发研究;2004年01期
14 冯利华,贾春瑶;主成分分析在环境质量评价中的失效问题[J];数学的实践与认识;2005年06期
15 杨茜;我国地区经济发展与环境污染状况的主成分分析[J];统计与决策;2005年18期
16 彭文甫;周介铭;袁耀林;周来东;何云洪;熊毅;;经营城市的途径选择[J];四川师范大学学报(自然科学版);2006年01期
17 王乃静;油永华;;基于Fisher判别分析的企业信用评价模型[J];技术经济与管理研究;2006年04期
18 耿修林;;基于主成分原理的多元质量控制图的构造[J];数理统计与管理;2007年01期
19 赵息;肖铮;何辉渝;;Logistic模型在上市公司财务预警中的应用研究[J];西安电子科技大学学报(社会科学版);2007年02期
20 贾秀芹;习丽;;综合评价的多元统计分析方法[J];青海大学学报(自然科学版);2007年04期
中国重要会议论文全文数据库 前10条
1 陈伟福;冯国灿;;局部光滑主成分分析[A];第十五届全国图象图形学学术会议论文集[C];2010年
2 陈明星;缪柏其;靳韬;;利率影响因素的主成分分析与因子分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 胡汪洋;景玎;冯民;于宏民;;沈阳市自然资源评价研究[A];科学发展与社会责任(B卷)——第五届沈阳科学学术年会文集[C];2008年
4 农吉夫;金龙;;均生函数与人工神经网络相结合的降水预报模型研究[A];第二十七届中国控制会议论文集[C];2008年
5 任丽娜;翟宇梅;王力维;;选择最优预报因子对华北1月份温度进行预报[A];第28届中国气象学会年会——S5气候预测新方法和新技术[C];2011年
6 张普敦;周艳明;;红外显微图像的主成分分析方法研究[A];第十届中国化学会分析化学年会暨第十届全国原子光谱学术会议论文摘要集[C];2009年
7 曹新向;苗长虹;;休闲城市评价指标体系及其应用研究[A];中国地理学会2007年学术年会论文摘要集[C];2007年
8 吕青涛;仲晓宁;张兆旺;孙秀梅;容蓉;;乙肝颗粒剂指纹图谱-模式识别研究[A];2011年中国药学大会暨第11届中国药师周论文集[C];2011年
9 孙洪元;杜文侠;刘克嘉;;人体健康功能态的主成分分析[A];第四届全国人—机—环境系统工程学术会议论文集[C];1999年
10 吴旗韬;张虹鸥;岑倩华;;泛珠三角区域竞争力梯度分布[A];中国地理学会2007年学术年会论文摘要集[C];2007年
中国博士学位论文全文数据库 前10条
1 姚焕玫;基于GIS技术的湖泊水质污染综合评价的研究[D];武汉大学;2005年
2 刘凯;提升西安城市竞争力的系统研究[D];西北工业大学;2007年
3 张旭明;产业集群持续成长因素分析与实证研究[D];吉林大学;2008年
4 尹春丽;昌黎原产地葡萄酒三维荧光光谱及电子舌特征研究[D];西北农林科技大学;2008年
5 徐琼;基于技术效率的区域经济竞争力提升研究[D];浙江大学;2006年
6 吴艳;上海市知识服务业发展研究[D];复旦大学;2007年
7 张超;水土保持区划及其系统架构研究[D];北京林业大学;2008年
8 史英杰;东北地区资源型城市产业转型问题研究[D];天津大学;2008年
9 王海贤;有限混合模型、非线性二维主成分分析及其在模式分类中应用[D];安徽大学;2005年
10 张亚刚;基于广域信息的电力系统故障元件定位方法研究[D];华北电力大学(北京);2011年
中国硕士学位论文全文数据库 前10条
1 赵建华;基于多元t分布的概率主成分分析及其应用[D];东南大学;2002年
2 王建新;我国上市公司财务危机远期预警模型研究[D];天津科技大学;2005年
3 廖宁;中国高尔夫球场数量预测和发展研究[D];北京林业大学;2008年
4 秦昌才;中国上市公司股权治理的实证研究[D];东北财经大学;2005年
5 王欣;四川省上市公司运营状况及其对四川经济的贡献研究[D];西南交通大学;2005年
6 张艳娜;山东财政学院学生综合素质评价研究[D];天津大学;2005年
7 代金博;财务报表分析与中国股市超额收益的概率预测[D];华中科技大学;2005年
8 刘小力;隆盛公司财务分析及管理对策研究[D];大连理工大学;2006年
9 陈福;现代企业财务困境预警及防范实证研究[D];南昌大学;2006年
10 罗世勇;江西省区域经济差异及其协调发展研究[D];南昌大学;2006年
中国重要报纸全文数据库 前10条
1 叶东云;统计主成分分析的应用问题[N];延安日报;2009年
2 王新亮 王娟;今年上半年股价涨幅前20上市公司绩效分析(上)[N];财会信报;2007年
3 ;城市投资环境评价指标体系及研究方法[N];中国信息报;2006年
4 湘财证券研究所 汪先珍;三季“多云”四季“晴” 长债当歌短债吟[N];中国证券报;2010年
5 陈东理;如何把握股指期现套利投资机会[N];期货日报;2007年
6 记者 王宝琳;我首次采用基因组学技术研究中药[N];科技日报;2009年
7 北京交通大学经济管理学院 穆岩;改善人力资本状况 提升区域竞争力[N];经济日报;2004年
8 郭寅龙 王昊阳;建立中药质检认可体制[N];上海中医药报;2002年
9 王新亮 王娟;今年上半年度股价涨幅前20上市公司绩效分析(下)[N];财会信报;2007年
10 李杰;三种设施作物生长发育过程模拟和仿真技术研究[N];科技日报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978