收藏本站
《浙江大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

高维数据的统计推断

项燕彪  
【摘要】:高维数据分析被广泛地应用于各个领域,如计算生物学,医学,金融分析,风险控制等。在本文中,我们将致力于统计中的高维数据分析,具体地,我们主要考虑以下两个方面:高维假设检验和高维变量选择。 首先,我们将简要介绍一下统计中的高维数据分析的现状。其次,我们考虑高维情形下,变量集之间独立性的假设检验问题。我们将给出一个新的检验统计量,并且,在样本量和维数一起趋于无穷的情形下,给出该统计量在原假设成立下的渐近分布。因此,该统计量可以应用于维数与样本量接近,甚至大于样本量的情形。接着,我们研究了高维情形下自适应Lasso (Adaptive Lasso)的性质。特别地,我们考虑线性回归模型的误差项具有比高斯型尾概率分布更一般的分布,即只要求误差项具有有限的2k阶矩,k0。在此条件下,我们证明了自适应Lasso仍具有Oracle'性质。进一步,我们给出了一种两步骤(Two-step)的方法,来处理超高维数据。之后,我们考虑了高维情形下自适应集群Lasso (Adaptive group Lasso)的性质。类似于自适应Lasso,我们证明了高维情形下自适应集群Lasso的Oracle'性质。最后,我们研究了无穷方差自回归模型的变量选择问题。特别地,我们采用两种不同的惩罚方法来同时进行变量选择和参数估计。我们先采用自权重最小绝对偏差(SLAD)作为惩罚方法中的损失函数,结合自适应Lasso来建模,并证明了由此得到的估计具有模型选择的相合性和渐近正态性。然后,我们指出,若采用普通的最小绝对偏差(LAD)作为损失函数,能够有效地提高变量选择的精度,但是,我们不能得到最终估计的渐近分布。因此,如以变量选择为目的,后者更佳,但若需要对模型进行进一步的统计推断,则前者更适合。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:O212.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 吴晓萍;基于LASSO-CD方法的生存分析研究[D];兰州大学;2014年
【同被引文献】
中国期刊全文数据库 前5条
1 李新海;王娜;宋海燕;;关于生存分析中的统计方法及其应用[J];东北师大学报(自然科学版);2011年01期
2 田欣媛;周镭;;基于生存分析法的顾客生命周期计量研究——以商业银行信用卡顾客为例[J];管理学报;2011年03期
3 王树云;宋云胜;;线性模型下基于AIC准则的Bayes变量选择[J];山东大学学报(理学版);2010年06期
4 张欣峰;娄清涛;陆建邦;全培良;孙喜斌;;现时生存分析方法的应用实践与评价[J];中国卫生统计;2011年01期
5 闫丽娜;覃婷;王彤;;LASSO方法在Cox回归模型中的应用[J];中国卫生统计;2012年01期
中国博士学位论文全文数据库 前1条
1 王占锋;删失回归模型中若干统计问题的研究[D];中国科学技术大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 李跃波,刘朝荣;多元C_p值[J];应用概率统计;1996年02期
2 肖庆宪;汇率均值回复模型的统计推断[J];数量经济技术经济研究;2001年11期
3 罗建国;均数情结与统计推断[J];中国统计;2002年05期
4 安维默;用Excel进行统计推断(二)[J];北京统计;2003年09期
5 徐波;;统计推断与抽样[J];黔西南民族师范高等专科学校学报;2009年01期
6 周源泉,翁朝曦;AMSAA-BISE模型及其统计推断[J];系统工程与电子技术;1991年11期
7 邵军;;基于子样分位数和刀切法的统计推断[J];应用概率统计;1992年01期
8 O.J.W.F.Kardaun,D.Salomé,W.Schaafsma,A.G.M.Steerneman,J.C.Willems,D.R.Cox,朱钰;对关于统计推断性质的十四个难以理解和有待澄清的问题的思考(下)[J];统计与信息论坛;2005年01期
9 宋进;王平;王袆;;基于统计学原理的网络渗透测试技术研究[J];太原科技;2010年01期
10 陆智良;;子样优劣的检验[J];山西农业大学学报(自然科学版);1981年01期
中国重要会议论文全文数据库 前10条
1 凤四海;杨蓉;;统计推断与科学推断[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(下册)[C];2002年
2 颜承元;颜士华;;软件容错技术新探[A];第十一届全国煤矿自动化学术年会论文专辑[C];2001年
3 徐才万;孙孝云;;某大学学报(医学版)论著中统计推断应用缺陷分析[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
4 郝跃明;陈树铭;王云仙;;太阳能单晶硅生长前的化学清洗[A];中国第六届光伏会议论文集[C];2000年
5 王钧利;;混凝土灌注桩承载力的可靠性分析[A];第六届全国结构工程学术会议论文集(第三卷)[C];1997年
6 杨上山;邓倩妮;;基于统计推断的P2P信誉评估机制[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
7 吴福安;余茂德;程嘉翎;徐立;王茜龄;;应用Jackknife技术对桑红蜘蛛实验种群rm值变异的研究[A];中国蚕学会第七届二次理事会暨学术年会论文集[C];2005年
8 肖庆宪;;变系数Black-Scholes模型的统计推断[A];发展的信息技术对管理的挑战——99’管理科学学术会议专辑(下)[C];1999年
9 杨振海;张国志;;随机推断和模拟估计[A];江苏省现场统计研究会第11次学术年会论文集[C];2008年
10 韦博成;;非线性回归模型[A];江苏省现场统计研究会第九次学术年会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 俞建拖;发展的天空其实非常高远[N];上海证券报;2008年
2 刘勒;用统计捕捉先兆异常[N];中国质量报;2009年
3 中央财经大学财经研究所 王卉彤;社会资本与民间金融可良性互动[N];证券日报;2005年
4 唐旭;金融研究要有科学的方法[N];金融时报;2005年
5 李培林;我国当前社会存在的潜在问题及其分析[N];中国社会科学院院报;2004年
6 记者 鲁仪诗;佛山陶企又遭巴基斯担反倾销[N];民营经济报;2006年
7 本报实习记者  王梦洁 张玉香;农民工:我们期待更多权益保障[N];中华建筑报;2007年
8 乔晓春;社会科学应强调研究方式的科学性[N];光明日报;2002年
9 刘平;《现代统计研究》结项和出版研讨会召开[N];中国信息报;2006年
10 李子木;拖欠款拷问发行业诚信[N];中国新闻出版报;2008年
中国博士学位论文全文数据库 前10条
1 赵越;半参数模型的统计推断及其在金融中的应用[D];大连理工大学;2010年
2 项燕彪;高维数据的统计推断[D];浙江大学;2011年
3 裴艳波;基于双边相关两值数据的统计推断[D];东北师范大学;2010年
4 吴茗;非简单随机抽样下的一些统计推断问题[D];华中师范大学;2011年
5 Abdalroof M.Shaip;基于删失数据的统计推断[D];吉林大学;2013年
6 吴海英;生产过程评价指标的统计分析[D];郑州大学;2005年
7 程从华;生存分析中删失数据统计推断及其应用[D];兰州大学;2011年
8 覃文忠;地理加权回归基本理论与应用研究[D];同济大学;2007年
9 王汉超;半鞅的极限定理及其统计推断[D];浙江大学;2011年
10 赵华玲;逐段线性回归中变点问题的统计推断[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 黄华胜;学生对统计推断的理解[D];华东师范大学;2014年
2 王耀华;流行病学中剂量反应关系的建模及其趋势类型的统计推断[D];东北师范大学;2011年
3 李慧慧;非线性常微分方程的统计推断问题研究[D];西安电子科技大学;2014年
4 刘迪;复杂系统可靠度解析表达及部分特征的统计推断[D];哈尔滨理工大学;2010年
5 唐美燕;四舍五入数据对统计推断的影响分析[D];广西师范大学;2011年
6 林红梅;双参数指数分布参数的统计推断[D];山西师范大学;2012年
7 陈方尧;改进的单样本Youden指数统计推断方法及配对样本Youden指数的比较方法[D];南方医科大学;2013年
8 张霄帅;疾病遗传网络构建中两整体基因之间共关联作用的统计推断方法研究[D];山东大学;2012年
9 闫春霞;维修问题中的统计推断及δ-冲击模型的研究[D];燕山大学;2012年
10 任璐;体育统计应用中若干重要统计思想[D];安徽师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026