收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

复杂数据下分位数回归建模及其应用

陈雪蓉  
【摘要】:本文主要考虑复杂数据(右删失长度偏差数据、纵向数据、缺失数据)下基于分位数回归及非光滑估计方程的统计推断和变量选择问题.这些复杂数据都是金融,经济,生物和医学等领域中重要的数据类型,是现代统计学研究的前沿和热点问题之一 文章主要分为七章,第一章主要介绍研究背景和研究现状,我们所研究的问题、动机及本文的主要内容. 长度偏差数据在流行病队列学研究,疾病筛查实验,以及劳动力经济研究等很多实际应用领域中都会经常遇到,此类数据已经引起了人们的关注.现存的关于右删失长度偏差数据的研究均基于转移模型、比例风险模型及加速时效时间模型,目.均需假设删失变量独立于协变量.本文第二章首次对右删失长度偏差数据建立分位数回归模型,且.在删失变量依赖于协变量情形下用Cox模型对其进行辅助建模.通过构造逆概率加权方程处理长度偏差抽样引起的信息型删失,纠正此种有偏抽样及右删失的影响,并利用现代经典统计方法经验过程理论及半参数方法导出分位数回归估计的渐近性质.此分位数回归估计的方差可由较为简单的重抽样方法得到.数值模拟及美国Channing house数据集分析结果均可说明所提出方法表现不俗. 当各风险因素对响应变量的影响随着某个量如时间空间等发生变化,或者人们对风险暴露因素的动态影响及风险因素之间交互作用更感兴趣时,就需要进一步扩展第二章建立的常系数分位数回归模型.在第三章提出了右删失长度偏差数据下的变系数分位数回归模型,通过对删失变量建立Cox模型考虑其依赖于协变量情形,提出该数据下的复合分位数回归提高单个分位数回归估计效率.对函数系数进行局部线性拟合,并基于所构造的构造局部逆概率加权估计方程和局部逆概率复合加权估计方程,从而得到了函数系数的局部线性分位数回归估计以及局部线性复合分位数回归估计,并推导出了它们的渐近性质.蒙特卡洛模拟中考察了所得局部线性估计的小样本性质.实例分析说明了所提出方法的实用性. 第四章用条件矩限制模型对右删失长度偏差数据进行建模,该模型涵盖了条件均值回归及条件分位数回归等多种许多模型,是更为宽泛和一般的建模技术.基于建立的条件矩限制模型构造逆概率加权估计方程,并在广义矩方法框架下对其进行统计推断.值得注意的是本章可同时考虑非光滑和光滑的条件矩限制模型.本章导出了兴趣广义矩估计的相合性和渐近正态性.并且通过数值模拟考察了所提出方法的小样本表现. 纵向数据在医疗跟踪研究和经济研究中一类常见的数据.对纵向数据分析,人们常常应用条件均值回归和条件分位数回归模型进行拟合.现存的方法大多集中于观测过程完全独立,或者给定协变量的情况下条件独立于响应变量,同时也经常假设纵向观察是等时间间距的情形.但现实中很多纵向数据是不等距,观察时间点甚至是随机的.在第五章,我们对随机观测的纵向数据建立了条件分位数回归模型,同时基于计数过程理论建立了随机观察次数的变化率模型.通过构造非光滑估计方程,得到了条件分位数回归估计,并且推导了其渐近性质.通常一种简单的重抽样方法来估计渐近方差.模拟实验考查了所得估计的小样本性质,结果表明所提出的方法表现良好,最后,把所提出方法分析应用到膀胱癌数据分析中. 第六章中,采用SCAD和自适应LASSO惩罚函数考虑了第五章中提出信息型随机观测次数纵向数据的分位数回归模型的变量选择问题.基于惩罚分位数回归估计方程导出了惩罚分位数回归估计的oracle性质.另外,提出了复合分位数回归方法提高参数估计的有效性,且通过构造复合惩罚分位数回归估计方程来考虑纵向数据的变量选择问题,同时获得了相应的惩罚复合分位数回归估计的的oracle性质. 众所周知,当数据存在缺失的时候,直接插补缺失观测可能会导致估计方程有偏,违背了估计方程统计诊断的一个基本假设.最近Zhou, WanWang[1]提出了另外一种基于核的整体插补方法,其插补的目标是估计函数而非缺失数据本身,并且基于经验似然和广义矩估计方法导出了参数估计的渐近性质.但人们的方法需要假设估计方程是光滑的,这个假设将很多很重要的统计应用领域排除在外.因此,本文第七章的主要目标就是将Zhou, WanWang[1]推广到非光滑估计方程的情形下.当估计方程非光滑时,泰勒展式无法应用,这就要求提出另外一套完全不同的证明技巧.另外,为了得到渐近方差的估计,本章提出了两种重抽样方法.模拟研究和实例分析表明了所提出的方法在小样本下工作的很好.因此,提出的方法可以应用于分位数回归和秩回归,ROC曲线估计以及分布函数估计等领域.


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 施锡铨,范正绮;抽样调查中分位数估计及误差[J];统计研究;1993年05期
2 胡青帆,李翎;用百分位数估计偏态分布资料的正常值范围[J];化工劳动保护;2001年06期
3 周勇;右删失左截断情形下分布函数的分位数估计[J];应用数学学报;1997年03期
4 东宇,秦永松;有附加信息下φ-混合样本的M-估计及分位数估计的渐进性质[J];四川大学学报(自然科学版);2005年04期
5 喜代保志;J.R.斯特丁吉;S.J.布尔吉斯;胡四一;;对数正态分位数的估计:蒙特卡洛结果和一阶近似[J];华水科技情报;1985年02期
6 吴庆波;李再兴;景平;;一元Cauchy分布族中两参数的分位数估计及其性质[J];廊坊师范学院学报(自然科学版);2010年01期
7 杜雪樵;线性模型中回归分位数估计的强相合性[J];应用数学;1995年02期
8 周慧;曾箫潇;;ρ-混合样本下VaR样本分位数估计的Bahadur表示[J];柳州师专学报;2009年03期
9 张建同;基于神经元网络的条件分位数估计的收敛速度(英文)[J];应用概率统计;2004年01期
10 吴建南;马伟;;分位数回归与显著加权分析技术的比较研究[J];统计与决策;2006年07期
11 欧阳资生;;厚尾分布的极值分位数估计与极值风险测度研究[J];数理统计与管理;2008年01期
12 冯士雍;孙山泽;毕健;;人体测量抽样方案目标量的估计及样本量的确定[J];应用概率统计;1989年04期
13 杨婧;宋向东;于尚洋;温育芳;;基于GRSS的均匀分布分位数的估计[J];佳木斯大学学报(自然科学版);2007年06期
14 C.W.J.Granger;赵文奇;;二十年来的组合预测[J];预测;1991年03期
15 罗纯,王筑娟;Gumbel分布参数估计及在水位资料分析中应用[J];应用概率统计;2005年02期
16 杨维珍;陈波;李剑君;;区间约束数据条件分位数估计的大样本性质[J];凯里学院学报;2010年03期
17 欧阳资生;杨向群;陈内萍;;一种概率分布的极值分位数的最优估计[J];应用概率统计;2008年05期
18 J·R·斯特丁格;丛树铮;;具有指定洪水风险的设计事件[J];华水科技情报;1984年04期
19 D.P.李坦梅尔;许大明;;区域洪水频率分析[J];河海大学科技情报;1986年S1期
20 周勇;光滑分布函数分位数估计的注记(英)[J];应用数学;1997年04期
中国重要会议论文全文数据库 前10条
1 陈娟;林龙;叶阿忠;;基于分位数回归的中国居民消费研究[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
2 林艺圃;;中国股市价量关系的实证分析分位数回归模型[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
3 易当祥;刘春和;王肇赢;封艳文;;电子设备加速寿命试验优化设计方法研究[A];中国电子学会可靠性分会第十四届学术年会论文选[C];2008年
4 许;刘征宇;张利萍;;太原市供水调度系统——SCADA系统结构与功能设计[A];《制造业自动化与网络化制造》学术交流会论文集[C];2004年
5 王可;王晓磊;付玉升;孙凤;;开放式的专用螺杆铣床数控系统研究[A];2005年中国机械工程学会年会论文集[C];2005年
6 秦克景;王显明;;天津开发区燃气管网SCADA系统的设计与实现[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
7 钱清泉;;铁路配电网自动化发展与展望[A];推进铁路新跨越加快经济大发展——中国科协2004年学术年会铁道分会场论文集[C];2004年
8 纪良文;;Lonworks现场总线在水闸泵站SCADA系统中的应用[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年
9 周密;张广胜;;新生代农民工市民化的阻碍[A];加大城乡统筹力度 协调推进工业化、城镇化与农业农村现代化[C];2010年
10 毕越凯;苏晓阳;孙进平;王文光;;对称α-稳定分布参数估计问题的优化算法研究[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 陈雪蓉;复杂数据下分位数回归建模及其应用[D];云南大学;2012年
2 关静;分位数回归理论及其应用[D];天津大学;2009年
3 韩月丽;极值统计与分位数回归理论及其应用[D];天津大学;2009年
4 李红梅;居民收入的分位数回归与反事实因素分解[D];首都经济贸易大学;2012年
5 解其昌;分位数回归方法及其在金融市场风险价值预测中的应用[D];西南财经大学;2012年
6 吕向东;C-D生产函数参数估计的分位数回归方法研究[D];首都经济贸易大学;2012年
7 李周平;经验似然方法的若干应用[D];兰州大学;2010年
8 杨晓蓉;自回归时间序列的极限理论及其应用[D];浙江大学;2008年
9 黄宇慧;我国粮食供给与需求综合平衡分析[D];东北财经大学;2010年
10 亓寿伟;转型期中国居民主观幸福感的计量分析[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 张晓丹;分位数回归及其在糖尿病治疗中的应用[D];天津大学;2010年
2 郝亦朗;分位数回归与金融风险研究[D];首都经济贸易大学;2011年
3 李振鹏;基于分位数回归模型的中国股市风险测量研究[D];东北财经大学;2010年
4 张明宇;分位数回归在金融风险管理中的应用[D];长春工业大学;2011年
5 李士民;基于分位数回归的中国居民消费[D];长春工业大学;2012年
6 杨鹏举;分位数回归在非寿险保费厘定中的应用与研究[D];吉林大学;2011年
7 张海云;基于分位数回归的股指期货风险度量研究[D];浙江工商大学;2012年
8 盛选义;时间序列分位数回归模型的实证分析[D];天津大学;2012年
9 彭良玉;分位数回归在时间序列中的应用[D];天津大学;2010年
10 付月;基于MM算法的分位数计算方法[D];延边大学;2010年
中国重要报纸全文数据库 前7条
1 王春蓉;实现ERP与SCADA系统的集成[N];计算机世界;2005年
2 记者 龚杰;AdAstrA集团明年加大在华投入[N];计算机世界;2002年
3 北京亚都科技股份有限公司总经理 何鲁敏;IAQ的评价(四)[N];中华建筑报;2003年
4 张凤英 耿亚彬;长输管道网络控制系统研究[N];石油管道报;2005年
5 栾威武;应加强污水厂的信息化建设[N];中国建设报;2004年
6 刘敬童;哈国征战 成果辉煌[N];石油管道报;2004年
7 王晓明;零度起飞[N];石油管道报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978