收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

关于模型稀疏性的研究

安百国  
【摘要】:随科学技术的发展,人们在生产生活中收集了大量的复杂数据。在针对这些数据进行统计分析的过程中,构建一个简单高效的模型至关重要。一个简单的稀疏模型不仅具有很好的解释性,常常也具有很高的性能。本文的主要工作就是对一些统计模型做了稀疏性研究。 现今,针对线性模型的稀疏性研究已经很成熟。因此我们首先概述了线性模型的稀疏性方法。针对多变量回归模型的稀疏性研究也有很多,然而这些研究大多只是针对预测变量的稀疏性,关于多维响应变量的稀疏性研究并不多见。在本文的第二章,我们针对多变量线性回归的稀疏性做了一些研究,这里的稀疏性不仅仅针对预测变量,同时也针对多维的响应变量。我们首先研究了多变量线性回归和典型相关分析的关系,然后通过研究典型载荷的稀疏性来研究多变量线性回归模型的稀疏性。理论结果表明我们的方法具有选择相合性。大量的数值模拟研究也佐证了我们的理论结果。 有监督分类学习在现实世界的诸多领域中都有大量的应有,这些领域包括医学诊断、手写体识别、网页数据挖掘、文本分类,等等。迄今大量的有监督分类方法已被提出,这些方法包括线性(二次)判别分析,逻辑斯蒂回归,最近邻方法,朴素贝叶斯分类器,支持向量机(SVM),等等。在这些分类方法中,朴素贝叶斯分类器由于其计算简单,性能优越等优点被广泛应用。然而据我们所知,迄今关于超高维朴素贝叶斯分类器的统计显著性研究并没有得到很好的研究。在本文的第三章,我们针对超高维朴素贝叶斯分类器,提出了一个全新的统计量来研究它的统计显著性,理论结果保证我们所提统计量的渐近正态性。同时我们的数值模拟研究也佐证了我们的理论发现,此外我们还尝试了利用我们所提的检验统计量通过假设检验的方法对朴素贝叶斯分类器进行变量选择,从而可以得到一个稀疏的朴素贝叶斯分类器,在保证分类精度的同时,使分类器更加具有解释性。 很多数据分析的统计方法都需要一个好的协方差矩阵或协方差逆阵的估计。这些方法包括:线性(二次)判别分析,主成分分析,典型相关分析,高斯图模型,等等。传统上,用样本协方差阵估计协方差矩阵是一个不错的选择。然而随着科学技术的发展,人们在科学和实际应用领域针对每个个体可以收集很多指标变量,然而样本量却由于许多实际的原因不能很大。在这种情形下,变量的维数通常远远大于样本量,因此样本协方差矩阵不再是正定的,然而正定性在大部分多变量统计分析方法中是被要求的。所以,在这种高维情形下,非常有必要对协方差矩阵或者其逆阵寻求一个好的估计。在本文的第四章,我们提出了一种新颖的假设检验方法来确定协方差逆阵的阶数。理论结果表明我们所提出的检验统计量在原假设下是渐近标准正态的,而且数值模拟结果能够很好的佐证我们的理论发现。模拟结果同样表明我们的方法在大部分情形下能够很好的估计出协方差逆阵的阶数。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李跃平;黄子杰;;典型相关分析在量表效标效度考核中的作用[J];福建师范大学学报(自然科学版);2007年04期
2 童善群;单指标经纬仪水平度盘偏心差的典型相关分析[J];测绘学院学报;1989年02期
3 岳荣先;鲁国斌;;典型相关分析的影响评价[J];东南大学学报(自然科学版);1993年01期
4 赵雅明,王翠艳,白轩;流化床生物质气化工艺中的典型相关分析[J];鞍山师范学院学报;1999年03期
5 龙凤莉;;我国城镇居民收入与支出关系的典型相关分析[J];吉林师范大学学报(自然科学版);2006年01期
6 王军虎;;我国制造业与现代服务业的典型相关分析[J];洛阳工业高等专科学校学报;2007年02期
7 曾思敏;陈圣滔;苏国会;余运君;万春春;王亮;;典型相关分析在银行资本结构与收益产出分析中的应用[J];成都大学学报(自然科学版);2009年01期
8 刘冬喜;;两组变量间相关关系的统计分析方法[J];高等数学研究;2011年01期
9 袁文斌;吴群英;鄢寒;;我国全社会固定资产投资与经济增长关系的典型相关分析[J];现代经济(现代物业下半月刊);2008年S1期
10 吴美晓;;广西房地产业与经济发展的典型相关分析[J];广西财经学院学报;2008年04期
11 何超琴;;典型相关分析在我国财政支出与居民支出分析中的应用[J];西安电子科技大学学报(社会科学版);2008年05期
12 龙文;王惠文;;成分数据相关系数的计算方法[J];数学的实践与认识;2008年24期
13 连高社;占健智;;我国生猪产业投入与产出的典型相关分析[J];全国商情(经济理论研究);2009年10期
14 陈正洪,杨荆安,张鸿雁;气温和降雨量与500 hPa高度场的CCA试验及其预报模式[J];气象科技;1999年02期
15 王立元,胡艳,王惠文;区间数据典型相关分析技术及其在股市分析中的应用[J];系统工程理论与实践;2005年01期
16 田静;;县域经济与城市化的相关分析[J];统计与信息论坛;2006年01期
17 高祥斌;;森林土壤化学性质与土壤酶活性典型相关分析[J];四川林勘设计;2006年03期
18 高祥斌;;森林土壤化学性质与土壤酶活性典型相关分析[J];林业科技;2007年01期
19 高祥斌;;森林土壤化学性质与土壤酶活性典型相关分析[J];四川林业科技;2007年01期
20 王芳;;城镇居民消费结构影响因素的典型相关分析[J];统计与决策;2007年03期
中国重要会议论文全文数据库 前10条
1 毛定祥;;运用典型相关分析分析股市的若干特性[A];中国现场统计研究会第九届学术年会论文集[C];1999年
2 徐向艺;郭妍;徐英吉;;企业技术创新与制度创新联动的典型相关分析——基于山东省的实证研究[A];决策与管理研究(2007-2008)——山东省软科学计划优秀成果汇编(第七册·上)[C];2009年
3 杨焰平;陈伟强;;云南农垦天然橡胶产业典型相关分析与可持续发展——基于欧美发达国家广泛关注的先进研究手段实证分析[A];云南省热带作物学会第七次代表大会暨2009年学术年会会议材料[C];2009年
4 何丽娟;丁进国;韩桂凤;;典型相关分析在对体育大学生职业价值观研究中的应用[A];第七届全国体育科学大会论文摘要汇编(一)[C];2004年
5 苗敬毅;;山西省产业结构的典型相关分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
6 李智才;;用典型相关分析作山西夏季降水预测的研究[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“气候系统与气候变化”分会论文集[C];2003年
7 王阳;沈楚玉;;用典型相关分析建立MESFET线性统计模型[A];1991年全国微波会议论文集(卷Ⅱ)[C];1991年
8 蒋霈霖;;遥感图像混合谱解混的新方法[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年
9 娄德君;李治民;王冀;;降尺度方法在黑龙江省月气候预测中的应用[A];第28届中国气象学会年会——S5气候预测新方法和新技术[C];2011年
10 齐朝晖;姚盛姬;;大型稀疏有限元方程组的快速算法[A];计算力学研究与进展——中国力学学会青年工作委员会第三届学术年会论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 安百国;关于模型稀疏性的研究[D];东北师范大学;2012年
2 王国长;函数数据回归与降维[D];东北师范大学;2012年
3 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
4 李军祥;大型稀疏极大极小问题的数值方法[D];大连理工大学;2008年
5 於州;充分降维理论和方法的拓展研究[D];华东师范大学;2010年
6 余磊;低维测量空间中信号恢复算法[D];武汉大学;2012年
7 王明辉;企业员工组织社会化内容结构及其相关研究[D];暨南大学;2006年
8 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
9 闫铮;基于脑电节律的脑网络研究及应用[D];清华大学;2012年
10 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 隋晓丽;基于遥感与GIS的湖北省土地利用/覆被变化研究[D];中国科学院研究生院(测量与地球物理研究所);2004年
2 孙培立;辽宁省滨海湿地资源类型及时空演变的驱动力分析[D];辽宁师范大学;2007年
3 孔朝莉;农业投入产出统计模型建模方法的研究[D];辽宁师范大学;2004年
4 谷珊珊;领导能力与员工个人绩效的关系研究[D];西安理工大学;2006年
5 阮蓉;我国中小投资者法律保护的实证研究[D];吉林大学;2008年
6 于源;大豆组织蛋白的热特性及其与品质关系的研究[D];东北农业大学;2008年
7 李智沛;我国主要林产品进口影响因素分析[D];北京林业大学;2009年
8 赵琨;科技中介与科技产业集聚互动作用的量化研究[D];山东科技大学;2005年
9 刘元秀;上市公司竞争力的统计分析[D];新疆财经大学;2007年
10 朱慧;国际航运中心与国际金融中心关联度研究[D];上海交通大学;2008年
中国重要报纸全文数据库 前10条
1 首创期货研发中心金融工程组 徐泽平;方差-协方差法的VaR计量模型选择[N];期货日报;2007年
2 首创期货研发中心高级研究员 易骥;套期保值实证分析及模型选择[N];期货日报;2006年
3 李铭;拓扑控制[N];计算机世界;2004年
4 陈克艰;“单位”究竟是怎么回事?[N];天津日报;2004年
5 佘传奇 汤益民;股指期货风险的估测研究[N];期货日报;2007年
6 吴友灿;PTA与原油价格的相关性研究[N];期货日报;2008年
7 厉将斌;李海松;中医药进入器官移植领域[N];中国医药报;2002年
8 郝胜龙;多维数据结构理论在统计数据库结构设计中的应用[N];中国信息报;2003年
9 河南 EVAer;菜鸟也玩3D(下)[N];电脑报;2002年
10 晓申;中国啤酒构建“第五代”营销体系[N];经理日报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978