收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

高维数据变量选择的几点研究

于怡  
【摘要】:变量选择是高维数据分析的一个重要研究问题,而对似然函数加一个惩罚项是近些年使用最为广泛的变量选择方法。惩罚似然方法的提出始自上世纪六七十年代,但直到上世纪九十年代,统计学家才开始系统地研究惩罚似然方法的理论性质,其中研究较多的是线性模型和广义线性模型。针对具有重要实际应用背景的生存分析模型鲜有突破性的理论性质,其中的困难主要来源于生存分析数据的删失特征。本论文的一部分内容是针对生存分析模型研究惩罚似然方法的理论性质,主要研究了生存分析中最重要的Cox模型下惩罚似然估计量的oracle性质。我们在计数过程框架下研究高维、非齐次变量的Cox模型,在证明定理时,所加的正则条件仅加在真实的回归参数上,从而使得条件更自然,这有别于文献中其他方法所加条件。 在实际应用中,人们更感兴趣的是如何快速有效地获得合适的参数估计。近十几年来人们提出了各种算法,大部分可以归结为路径算法。似然惩罚估计量的求解是一个最优化问题,对于凸惩罚其算法相对简单,而对于非凸惩罚的算法往往复杂多了。我们在第三章中提出了一种新的路径算法,该方法与文献中已有方法的优点是,可以更容易找到全局最优解。可以针对凸惩罚和非凸惩罚都得到有效的路径解。通过数值计算比较发现新提出的算法在计算效率上与现有方法有较大的优势。 路径算法提供了一系列的解,必须从中选择最优的解,而针对低维数据的传统方法不适用于高维数据。大多数针对高维数据的前人工作是基于修正信息类准则,本文的第四章和第五章对交叉验证方法(一类数据驱动的方法)进行修正以分别应用于线性模型和广义线性模型,并证明了所得方法具有相合性,大量的模拟研究及实际数据分析结果证实了所提方法的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨力行 ,刘金清;投影寻踪应用技术在水文领域中喜获丰收[J];水文;1993年02期
2 蔡利平;周绪川;;高维数据上的自适应谱聚类降维方法研究[J];西南民族大学学报(自然科学版);2010年05期
3 毛林;陆全华;程涛;;基于高维数据的集成逻辑回归分类算法的研究与应用[J];科技通报;2013年12期
4 陈晓明;;海量高维数据下分布式特征选择算法的研究与应用[J];科技通报;2013年08期
5 刘立月;黄兆华;刘遵雄;;高维数据分类中的特征降维研究[J];江西师范大学学报(自然科学版);2012年02期
6 李祚泳;投影寻踪技术及其应用进展[J];自然杂志;1997年04期
7 王家耀;谢明霞;郭建忠;陈科;;基于相似性保持和特征变换的高维数据聚类改进算法[J];测绘学报;2011年03期
8 张娇;裘国永;张奇;;基于二分K均值的SVM决策树的高维数据分类方法[J];赤峰学院学报(自然科学版);2012年07期
9 周迪斌;蒋健明;胡斌;张量;;基于多GPU的千万级高维空间实时检索[J];科技通报;2013年01期
10 李泽安;陈建平;;高维数据挖掘中的正则化估计新方法[J];宁夏大学学报(自然科学版);2012年04期
11 黄利文;;高维数据的距离判别方法[J];通化师范学院学报;2013年04期
12 张航;PP型拟合优度检验[J];系统科学与数学;1988年03期
13 漆华;;高维数据平面表示的一种方法——Legendre Polynomial Method[J];八一农学院学报;1990年03期
14 谭璐,易东云,冯国柱,吴翊;局部不变投影[J];自然科学进展;2004年03期
15 谭鲜明;张润楚;;高维数据判别分析中的特征选择[J];数学物理学报;2006年05期
16 李顺勇;宋云胜;赵兴旺;;一种有效的面向高维数值型数据的聚类方法[J];山西大学学报(自然科学版);2014年02期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前6条
1 周煜人;彭辉;桂卫华;;基于映射的高维数据聚类方法[A];04'中国企业自动化和信息化建设论坛暨中南六省区自动化学会学术年会专辑[C];2004年
2 梁俊杰;杨泽新;冯玉才;;大规模高维数据库索引结构[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 陈冠华;马秀莉;杨冬青;唐世渭;帅猛;;面向高维数据的低冗余Top-k异常点发现方法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
4 刘运涛;鲍玉斌;吴丹;冷芳玲;孙焕良;于戈;;CBFrag-Cubing:一种基于压缩位图的高维数据立方创建算法(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 刘文慧;;PCA与PLS用于高维数据分类的比较性研究[A];2011年中国卫生统计学年会会议论文集[C];2011年
6 刘喜兰;冯德益;王公恕;朱成喜;冯雯;;脸谱分析在中进期地震跟踪预报中的应用[A];中国地震学会第四次学术大会论文摘要集[C];1992年
中国博士学位论文全文数据库 前10条
1 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年
2 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年
3 吴庆耀;高维数据的若干分类问题及算法研究[D];哈尔滨工业大学;2013年
4 楼巍;面向大数据的高维数据挖掘技术研究[D];上海大学;2013年
5 黄健美;高维数据索引及其查询处理技术研究[D];东北大学;2009年
6 任亚洲;高维数据上的聚类方法研究[D];华南理工大学;2014年
7 董道国;高维数据索引结构研究[D];复旦大学;2005年
8 于怡;高维数据变量选择的几点研究[D];复旦大学;2013年
9 谭璐;高维数据的降维理论及应用[D];国防科学技术大学;2005年
10 刘翠响;人脸识别中高维数据特征分析[D];河北工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 康永为;大数据环境下高维数据处理若干问题[D];广西师范大学;2013年
2 陈路莹;高维数据的聚类分析方法研究及其应用[D];厦门大学;2009年
3 王立强;基于多元统计图的高维数据降维方法及应用研究[D];燕山大学;2006年
4 戴继勇;基于投影的高维数据异常检测研究[D];重庆大学;2007年
5 屈治礼;高维数据可视化研究及在商业智能中的应用[D];江苏科技大学;2013年
6 谢明霞;高维数据聚类若干关键问题研究[D];解放军信息工程大学;2011年
7 易莉桦;高维数据聚类算法的研究[D];燕山大学;2012年
8 王冬秀;基于衰减窗口与剪枝链表树的高维数据流聚类算法研究[D];华东师范大学;2010年
9 刘天桢;高维数据可视化研究[D];武汉理工大学;2005年
10 熊琅环;基于遗传算法的高维数据聚类研究[D];汕头大学;2010年
中国重要报纸全文数据库 前1条
1 本报记者 李双艺;引领高维数据分析先河[N];吉林日报;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978