对几个统计模型的构造和数据分析
【摘要】:
通常统计模型是基于现实世界的数据而构造的;这些模型然后又被用于描述产生数据的现实。数据和
模型有非常密切的关系:一方面可以利用数据中所含有的信息来构造,核对和改进模型;另一方面,数据中
的少数的影响点可能会严重影响建模。所以,识别并妥善处理影响点或者利用数据本身的信息重构模型估
计过程往往会改进模型估计的精度。因此通过诊断手段来识别影响及根据数据的具体特征改进模型的有效
性在实践中是十分重要的。基于对上述方向的兴趣,本文的主要内容可以分为识别影响点和利用数据改进
模型两个方面。
诊断:
●识别偏最小二乘(PLS)模型的影响点:采用Wu Luo(1993a,b)提出的局部影响二阶诊断方法。
在推导出用X和Y直接表达的参数估计式,并解决了扰动后特征向量的二阶导数问题后,得到了
识别多重影响点的具体公式。模拟表明该方法好于逐点删除法。
●识别最小一乘(LAD)拟合的AR(p)模型中的影响点:采用的是Hampel(l974)提出的影响函数
的方法,以避免破坏时间序列数据的连续性。并参考了Jiang(2000)给出的渐近分布,得到识别公
式。
模型改进:
●改进PLS算法:在研究PLS模型受数据影响的情况时发现有一类数据在应用PLS的时候,效果
很差。分析这种情况出现的原因,并提出了改进办法。模拟表明,在处理这类数据时,该改进效果显
著。
●利用数据为生存函数的卷积型核估计选则合适的局部带宽;为此,研究了生存函数核估计的Bahadur
表示,推导出它的渐近均方误差的表达式,并用渐近均方误差达到最小作为选带宽的准则。模拟的结
果显示,对于常见的Weibull分布等生存函数,局部选带宽的核估计要优于传统的Kaplan-Meier
估计。
|
|
|
|
1 |
李永红;随机截断时生存函数的核估计[J];四川大学学报(自然科学版);1998年05期 |
2 |
汪明瑾,霍光林;生存函数Bayes估计的一种选代方法[J];平原大学学报;1999年02期 |
3 |
李永红;生存函数的一种估计方法及其相会结果[J];昆明师范高等专科学校学报;1994年S1期 |
4 |
郑明,何其祥;随机右截断情形下连续过程生存函数的估计及其性质[J];应用概率统计;2004年01期 |
5 |
陈彩琴;截尾情形下的生存函数的估计[J];浙江大学学报(理学版);1995年03期 |
6 |
吴贤毅,王静龙;分数年龄假设与生存函数的插值[J];华东师范大学学报(自然科学版);2001年04期 |
7 |
庄新田,黄小原;银行资产负债管理的模型及其优化[J];系统工程理论方法应用;2001年02期 |
8 |
卢江;关于Parzen核估计强相合的若干问题[J];四川大学学报(自然科学版);1985年03期 |
9 |
余昭平;条件中位数的核估计及其Bootstrap逼近[J];高校应用数学学报A辑(中文版);1988年04期 |
10 |
刘裔宏,王毓基;死力与生命表函数[J];系统工程;1992年02期 |
11 |
王炳章;关于回归函数的核估计的渐近正态性[J];湖北大学学报(自然科学版);1996年03期 |
12 |
胡明;马鸿杰;;基于核估计的缺损生存数据分析[J];统计与决策;2009年02期 |
13 |
方兆本,赵林城;非参数回归核估计的强相合性[J];应用数学学报;1985年03期 |
14 |
杜雪樵;回归函数的混合型核估计的一致强收敛速度[J];合肥工业大学学报(自然科学版);1992年04期 |
15 |
张文扬,张鸣;线性模型中误差分布的基于L_1估计的相合核估计[J];四川大学学报(自然科学版);1994年04期 |
16 |
刘海燕,赵联文;非参数估计中核估计的构造及相合性[J];西南交通大学学报(自然科学版);1999年03期 |
17 |
薛留根,胡玉萍;回归函数核估计的随机加权法[J];系统科学与数学;2001年01期 |
18 |
李永明,吴丽莎,徐健;一类函数估计在负相协下的渐近正态性[J];南昌大学学报(理科版);2005年05期 |
19 |
孙东初;回归函数的相合随机窗宽核估计[J];应用数学学报;1986年02期 |
20 |
王文圣,丁晶;基于核估计的多变量非参数随机模型初步研究[J];水利学报;2003年02期 |
|