收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

生存数据统计模型的变量选择方法

刘吉彩  
【摘要】:生存数据广泛出现在生物医学、经济金融、保险精算、可靠性工程等领域。由于生存数据一般都存在删失,完全数据下的统计方法几乎都会失效。因此,如何对其统计分析一直是一个方兴未艾的主题。而且,在许多的实际问题中,往往会观察到多个不同的生存时间,我们称为多元生存时间数据。该数据的主要特点是各类生存时间之间可能是相依性的。由于这种复杂的相依性和删失的存在,使得对多元生存时间数据的统计分析变得比较困难。然而,因其广泛的实用性价值,引起了越来越多学者的关注。 随着现代科技的发展,海量数据随处可见,特别是在生物信息、航空航天、人工智能以及电子商务等方面。这些海量数据的特点一般是维数很高、噪声很大。如何从这种高维数据中提取出有用信息是人们最为关心的问题。变量选择作为一种重要的信息提取工具,受到了统计学家们高度的重视。然而,经典的变量选择方法面对如此的高维数据有可能完全失去作用。为此,统计学家提出了各种的改进方法。其中,最为流行的方法就是正则化方法,如LASSO、SCAD以及MCP等。本文主要在生存数据,包括多元生存时间数据框架下研究正则化变量选择方法的三个问题:第一,结构化协变量的选择问题;第二,超高维,即p》n下的变量选择;第三,半参数回归模型的变量选择。 在本文的第二章中,基于可加危险率模型我们讨论具有组结构协变量的变量选择问题。研究的目标是同时识别重要的组内和组间变量。为此,我们考虑了一个层次化的惩罚方法。在协变量维数发散情况下,我们证明了所提估计的大样本性质。数值计算结果表明,在协变量具有组结构情况下,该方法优于现有的方法,如LASSO, SCAD和Adaptive LASSO等。最后,我们使用所提方法分析了一组基因数据。 本文的第三章主要研究,在协变量的维数p=O(exp(nδ))其中δ0情况下,可加危险率模型的一类非凸惩罚方法的大样本性质。在类似于Zhao and Yu[97]的不可忽略性条件(Irrepresentable Condition)下,我们证明了所提估计具有强Oracle性质。有趣的是该性质对LASSO同样适合。另外,我们也建立了该非凸惩罚估计(此时不包括LASSO)的渐近正态性。 本文的第四章以及第五章基于多元生存时间数据分别考虑部分变系数、部分线性比例危险率回归模型的变量选择问题。对于参数部分协变量的选择和估计,我们主要采用一步回切估计的思想。对于非参部分的重要性识别,主要是通过假设检验完成。在一些正则化条件下,我们分别获得了相应估计的Oracle性质。模拟结果证实所提方法具有很好的变量选择效果。最后,我们分别将该方法应用于结肠癌数据统计分析中。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙道德;再论线性模型自变元选择的BIC方法相容性条件[J];高校应用数学学报A辑(中文版);1995年01期
2 戴伯新;;回归变量选择中的数据诊断[J];应用概率统计;1992年04期
3 张大仁,赵立新;遗传算法对QSAR研究中变量选择的应用[J];环境化学;2000年03期
4 严于鲜;;层次分析法在线性回归方程中的应用[J];四川理工学院学报(自然科学版);2006年05期
5 罗英姿,张洁洋;用人工神经网络研究地方经济指标[J];河南广播电视大学学报;2005年02期
6 杨璐,高自友;用神经网络进行变量选择[J];北方交通大学学报;1999年03期
7 王今,韩文秀;财务危机预警中财务比率的选择研究[J];数学的实践与认识;2003年08期
8 韩敏,林云,孙燕楠,齐东海;基于神经网络的建筑行业投标报价研究[J];系统工程学报;2003年04期
9 陈战波;耿志林;杨珂玲;;城市日用水量预测的部分线性自回归模型[J];武汉工业学院学报;2009年02期
10 温忠麟;回归变量的一种选择方法及其应用[J];云南教育学院学报;1994年05期
11 张小亚;申琦;;基因表达式编程在环氧酶抑制剂定量构效关系中的应用[J];计算机与应用化学;2009年10期
12 杨宜平;薛留根;;高维部分线性模型的变量选择和估计(英文)[J];应用概率统计;2011年02期
13 田益祥;GMDH建模中变量选择的方法研究[J];安康师专学报;2001年04期
14 周一星,陈彦光;城市地理研究的几个基本问题[J];经济地理;2004年03期
15 孙道德;;随机回归模型选择的简单方法及其相合性[J];应用数学;2006年01期
16 徐慧;;资本结构的变量选择[J];沿海企业与科技;2006年11期
17 赵培信;;带有缺失数据线性回归模型的变量选择[J];河池学院学报;2009年02期
18 张海;王尧;常象宇;徐宗本;;L_(1/2)正则化[J];中国科学:信息科学;2010年03期
19 王占锋;吴耀华;赵林城;;删失回归模型中一个LASSO型变量选择和估计方法(英文)[J];应用概率统计;2010年01期
20 钟登华,刘豹,张世英,张维;非线性计量经济建模变量选择[J];天津大学学报;1993年03期
中国重要会议论文全文数据库 前10条
1 胡军华;蒋志刚;;环境变量选择与尺度变化对物种适宜栖息地模拟的影响:以普氏原羚为例[A];四川省动物学会第九次会员代表大会暨第十届学术研讨会论文集[C];2011年
2 李洪东;梁逸曾;;高维数据变量选择新方法研究[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
3 李慷;席裕庚;;带有输出反馈的多变量控制系统中变量的选择[A];1994中国控制与决策学术年会论文集[C];1994年
4 刁宁;张永清;;改进蚁群算法在麻痹性贝毒素的QSAR中变量选择的研究[A];第五届全国环境化学大会摘要集[C];2009年
5 韩敏;林云;;用神经网络的方法进行投标报价中的变量选择[A];第二十届中国控制会议论文集(下)[C];2001年
6 黄蓉;乔园园;;指示向量选择法在QSAR研究中的应用[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
7 张俊华;方伟武;;调查表数据分析中变量选择和判别分析的一些方法及简单比较[A];面向复杂系统的管理理论与信息系统技术学术会议专辑[C];2000年
8 张永清;费红琳;丁凯;;修正CP_EA-PLS用于多环芳烃光解半衰期QSAR的研究[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
9 梁逸曾;李洪东;许青松;曹东升;张志敏;;灰色化学建模与模型集群分析——兼论过拟合、稳健估计、变量选择与模型评价[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
10 刘咸姝;潘日芳;;满意控制结构综合的专家系统[A];1996年中国智能自动化学术会议论文集(上册)[C];1996年
中国博士学位论文全文数据库 前10条
1 刘吉彩;生存数据统计模型的变量选择方法[D];华东师范大学;2014年
2 王明秋;高维数据下若干回归模型的变量选择问题研究[D];大连理工大学;2012年
3 盖玉洁;若干高维模型变量选择和模型重建问题的研究[D];山东大学;2011年
4 任允文;基于处罚经验似然和跳惩罚最小二乘的变量选择[D];复旦大学;2010年
5 赵为华;变系数模型变量选择的稳健方法[D];华东师范大学;2013年
6 李腾飞;似然自适应惩罚变量选择方法研究[D];复旦大学;2012年
7 吕亚召;含指标项半参数回归模型的分位数回归与变量选择[D];华东师范大学;2013年
8 袁晶;贝叶斯方法在变量选择问题中的应用[D];山东大学;2013年
9 王树云;基于Bayes方法和图限制下正规化方法的变量选择问题及其在基因组数据中的应用[D];山东大学;2010年
10 陶凤梅;对应分析的数学模型[D];吉林大学;2005年
中国硕士学位论文全文数据库 前10条
1 龙旭霞;基于互信息的变量选择方法研究[D];中南大学;2013年
2 胡俊英;基于切比雪夫损失的变量选择方法[D];西北大学;2013年
3 李玲玲;高维线性模型的变量选择[D];广西师范大学;2010年
4 闫闯;多元回归模型中变量选择问题研究[D];黑龙江大学;2011年
5 鞠思秋;半参数变系数部分线性模型的变量选择方法[D];华东师范大学;2012年
6 王慧;生存分析中半参数模型的变量选择方法及其模拟研究[D];山西医科大学;2013年
7 刘存银;基于修正经验似然的变量选择方法及其应用研究[D];华东理工大学;2011年
8 刘琳;几类回归模型中的变量选择方法[D];广西大学;2013年
9 肖金花;函数系数部分线性模型的变量选择[D];湖南师范大学;2012年
10 梁爱;半参数变系数部分线性测量误差模型的变量选择[D];华东师范大学;2011年
中国重要报纸全文数据库 前10条
1 周益散 夏斐然 杨光;教育有利器 创新无边际[N];新农村商报;2011年
2 广发期货分析师 许江山;基本面边际改善将推动股市商品上行[N];证券时报;2011年
3 徐澄;50岁前多吃肥鱼[N];健康时报;2008年
4 杨丽生;“危险率”是衡量经营安全的信号[N];中国乡镇企业报;2004年
5 记者 孙涛 见习记者 牟联文 通讯员 孙朝运;构筑鄂渝边际交通枢纽[N];恩施日报;2010年
6 王自然 彬龙俊;川滇两省五县十所建立边际协作机制[N];人民公安报;2011年
7 本报记者 孙秀艳;EoN:飞越网络边际[N];市场报;2000年
8 海青;多吃全麦食品和鱼可预防儿童哮喘[N];医药经济报;2007年
9 钟文彬;吸烟乃百病之源[N];大众科技报;2002年
10 ;“网络边际”的精灵[N];网络世界;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978