收藏本站
《南开大学》 2001年
收藏 | 手机打开
二维码
手机客户端打开本文

对几个统计模型的构造和数据分析

程博  
【摘要】: 通常统计模型是基于现实世界的数据而构造的;这些模型然后又被用于描述产生数据的现实。数据和 模型有非常密切的关系:一方面可以利用数据中所含有的信息来构造,核对和改进模型;另一方面,数据中 的少数的影响点可能会严重影响建模。所以,识别并妥善处理影响点或者利用数据本身的信息重构模型估 计过程往往会改进模型估计的精度。因此通过诊断手段来识别影响及根据数据的具体特征改进模型的有效 性在实践中是十分重要的。基于对上述方向的兴趣,本文的主要内容可以分为识别影响点和利用数据改进 模型两个方面。 诊断: ●识别偏最小二乘(PLS)模型的影响点:采用Wu Luo(1993a,b)提出的局部影响二阶诊断方法。 在推导出用X和Y直接表达的参数估计式,并解决了扰动后特征向量的二阶导数问题后,得到了 识别多重影响点的具体公式。模拟表明该方法好于逐点删除法。 ●识别最小一乘(LAD)拟合的AR(p)模型中的影响点:采用的是Hampel(l974)提出的影响函数 的方法,以避免破坏时间序列数据的连续性。并参考了Jiang(2000)给出的渐近分布,得到识别公 式。 模型改进: ●改进PLS算法:在研究PLS模型受数据影响的情况时发现有一类数据在应用PLS的时候,效果 很差。分析这种情况出现的原因,并提出了改进办法。模拟表明,在处理这类数据时,该改进效果显 著。 ●利用数据为生存函数的卷积型核估计选则合适的局部带宽;为此,研究了生存函数核估计的Bahadur 表示,推导出它的渐近均方误差的表达式,并用渐近均方误差达到最小作为选带宽的准则。模拟的结 果显示,对于常见的Weibull分布等生存函数,局部选带宽的核估计要优于传统的Kaplan-Meier 估计。
【学位授予单位】:南开大学
【学位级别】:博士
【学位授予年份】:2001
【分类号】:O212.1

【引证文献】
中国期刊全文数据库 前1条
1 汪春辉;罗飞;舒红平;;偏最小二乘回归在气温预测中的研究与应用[J];微计算机信息;2012年05期
中国博士学位论文全文数据库 前4条
1 蒋贤海;智能远程健康监护系统生理参数数据分析及预报的研究[D];华南理工大学;2011年
2 陈鸿蔚;交流异步电力测功机系统及其软测量技术研究[D];湖南大学;2009年
3 成忠;PLSR用于化学化工建模的几个关键问题的研究[D];浙江大学;2005年
4 白裔峰;偏最小二乘算法及其在基于结构风险最小化的机器学习中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前1条
1 李琼梅;缺失数据情形概率密度函数的统计推断[D];广西师范大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 李金平;截尾数据下寿命变量密度函数的直方估计[J];河南大学学报(自然科学版);1990年02期
2 陈彩琴;截尾情形下的生存函数的估计[J];杭州大学学报(自然科学版);1995年03期
3 周勇 ,孙六全 ,Paul S.F.YIP;The almost sure behavior of the oscillation modulus for PL-process and cumulative hazard process under random censorship[J];Science in China,Ser.A;1999年03期
4 蒋建成 ,程博 ,吴喜之;On estimation of survival function under random censoring model[J];Science in China,Ser.A;2002年04期
5 孙六全,朱力行;随机删失数据下核密度估计的Berry-Esseen界[J];数学学报;1999年04期
6 秦更生;RESIDUALS DENSITY ESTIMATION IN CENSORED LINEAR REGRESSION MODEL[J];Acta Mathematicae Applicatae Sinica(English Series);1999年01期
7 王启华;基于截尾数据概率密度核估计的一些渐近行为(英文)[J];应用概率统计;1994年02期
8 冯琦琳,卢江;截断样本下的强率函数和密度函数核估计的渐进正态性(英文)[J];应用概率统计;1998年02期
9 陈清平,戴永隆;右删失混合相依模型下几种危险率函数估计的渐近性质[J];应用概率统计;2005年01期
10 解锋昌;韦博成;;多元t分布数据的局部影响分析[J];应用概率统计;2006年02期
中国博士学位论文全文数据库 前1条
1 蒋贤海;智能远程健康监护系统生理参数数据分析及预报的研究[D];华南理工大学;2011年
中国硕士学位论文全文数据库 前1条
1 梁霞;缺失数据的多重插补及其改进[D];中南大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 万晓莉,吴建乐;基于模糊关系的非线性系统辨识研究[J];北方工业大学学报;2003年03期
2 刘强,尹力;一种简化递推偏最小二乘建模算法及其应用[J];北京航空航天大学学报;2003年07期
3 王惠文;变量多重相关性对主成分分析的危害[J];北京航空航天大学学报;1996年01期
4 张明廉,杨亚炜;作为通用逼近子的模糊系统及其逼近性质[J];北京航空航天大学学报;1999年03期
5 刘金福,洪伟,李俊清;格氏栲天然林物种多度分布的核估计研究[J];北京林业大学学报;2002年Z1期
6 崔恒建,王雪峰;核密度估计及其在直径分布研究中的应用[J];北京林业大学学报;1996年02期
7 姬军,董秀珍,王海滨,漆家学,王丹,张鹏;心电信号QRS波的识别算法及程序设计[J];北京生物医学工程;2001年02期
8 芦继来,胡广书;基于小波变换的运动心电ST段检测方法[J];北京生物医学工程;2005年05期
9 万相奎,秦树人,梁小容,叶顺流;小波变换在心电信号特征提取中的应用[J];北京生物医学工程;2005年06期
10 任文军;宋向东;;核密度估计中递归方法选择窗宽及其应用[J];长春大学学报;2009年02期
中国博士学位论文全文数据库 前5条
1 姚莉秀;数据信息采掘技术在冶金、化工中的若干应用[D];中国科学院上海冶金研究所;2000年
2 王寅;化工过程混合建模问题研究[D];浙江大学;2001年
3 李志华;循环子空间回归建模和多智能体遗传优化[D];浙江大学;2003年
4 刘瑞兰;软测量技术若干问题的研究及工业应用[D];浙江大学;2004年
5 苏丽;远程心电监护诊断系统心电信号处理方法研究[D];哈尔滨工程大学;2006年
中国硕士学位论文全文数据库 前7条
1 赵颖;球面变换核估计及其一致收敛速度[D];北京工业大学;2001年
2 武娇;偏最小二乘回归模型及其在教育统计中的应用[D];陕西师范大学;2002年
3 蒋红卫;偏最小二乘回归的扩展及其实用算法构建[D];中国人民解放军第四军医大学;2003年
4 梁林;基于非线性部分最小二乘的软测量建模方法研究[D];清华大学;2000年
5 汪小勇;基于多元统计投影方法的工业过程软测量技术研究[D];浙江大学;2004年
6 张艳丽;最近邻密度估计的大样本性质[D];武汉大学;2005年
7 范承华;缺失数据半参数回归分析[D];北京工业大学;2007年
【二级引证文献】
中国期刊全文数据库 前4条
1 朱天竑;陈德钊;;化学化工数据局外点检测方法研究进展[J];化工进展;2006年08期
2 潘国锋;杨慧中;孔军;;基于小波数据压缩的光谱技术在水质分析中的应用[J];红外与毫米波学报;2010年05期
3 李波;李大治;张英达;;大坝安全监控的递推PLSR模型[J];水力发电;2008年06期
4 周建新;吴盈;司风琪;徐治皋;;基于非线性块式递推偏最小二乘法的电站热力过程动态数据检验[J];中国电机工程学报;2012年29期
中国博士学位论文全文数据库 前4条
1 郭建校;改进的高维非线性PLS回归方法及应用研究[D];天津大学;2010年
2 成飙;两种随机优化算法的改进及其化工应用研究[D];浙江大学;2007年
3 孙晏一;道桥结构健康监测中的数据甄别处理技术研究[D];吉林大学;2012年
4 杨佳佳;基于多源遥感数据的青海格尔木地区岩矿信息提取研究[D];吉林大学;2012年
中国硕士学位论文全文数据库 前10条
1 韩艳;基于支持向量机的发酵过程建模研究[D];大连理工大学;2010年
2 杨军;辽沈地区静压管桩单桩竖向承载特性分析方法研究[D];沈阳建筑大学;2011年
3 李斌;基于模式识别技术的眼科疾病辅助诊断系统的研究[D];吉林大学;2011年
4 李波;基于偏最小二乘回归的大坝安全监控统计模型的研究[D];西安理工大学;2007年
5 朱天竑;化学化工数据局外点检测及其应用[D];浙江大学;2006年
6 柳利利;偏最小二乘回归在大坝安全监测资料分析中的应用研究[D];西安理工大学;2008年
7 罗杰;基于MSPC的故障检测与诊断方法研究[D];沈阳理工大学;2008年
8 李建伟;基于偏最小二乘回归的混凝土坝变形监控模型研究[D];西安理工大学;2009年
9 孙凤林;偏最小二乘回归法非线性建模及其递推算法的研究[D];华南理工大学;2010年
10 袁勇;基于多向偏最小二乘的间歇过程软测量建模研究[D];东北大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 李永红;随机截断时生存函数的核估计[J];四川大学学报(自然科学版);1998年05期
2 汪明瑾,霍光林;生存函数Bayes估计的一种选代方法[J];平原大学学报;1999年02期
3 李永红;生存函数的一种估计方法及其相会结果[J];昆明师范高等专科学校学报;1994年S1期
4 郑明,何其祥;随机右截断情形下连续过程生存函数的估计及其性质[J];应用概率统计;2004年01期
5 陈彩琴;截尾情形下的生存函数的估计[J];浙江大学学报(理学版);1995年03期
6 吴贤毅,王静龙;分数年龄假设与生存函数的插值[J];华东师范大学学报(自然科学版);2001年04期
7 庄新田,黄小原;银行资产负债管理的模型及其优化[J];系统工程理论方法应用;2001年02期
8 卢江;关于Parzen核估计强相合的若干问题[J];四川大学学报(自然科学版);1985年03期
9 余昭平;条件中位数的核估计及其Bootstrap逼近[J];高校应用数学学报A辑(中文版);1988年04期
10 刘裔宏,王毓基;死力与生命表函数[J];系统工程;1992年02期
中国重要会议论文全文数据库 前10条
1 叶阿忠;;我国通货膨胀的核估计和k-近邻估计[A];计算机模拟与信息技术会议论文集[C];2001年
2 叶明确;张世英;;复杂系统的质量生存交互决策[A];2002中国控制与决策学术年会论文集[C];2002年
3 杨复兴;;概率密度函数的广义最小二乘估计[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
4 赵颖;杨振海;;球面数据回归函数核估计的收敛速度[A];2003中国现场统计研究会第十一届学术年会论文集(下)[C];2003年
5 陈继业;;对组合火工品双向点火的研究[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(下册)[C];2001年
6 余红梅;王彤;刘桂芬;王琳娜;张岩波;仇丽霞;赵晋芳;;Cox回归模型诊断及其医学应用研究报告[A];2005—2006山西省统计科研成果汇编[C];2006年
7 李方;石廷章;;Ⅳ期胃肠道肿瘤腹腔化疗的近期疗效评价及生存分析[A];2000全国肿瘤学术大会论文集[C];2000年
8 赵冰;岳德权;田瑞玲;李成钢;;随机部件个数的串、并联系统的随机比较与寿命分布类性质[A];第五届中国不确定系统年会论文集[C];2007年
9 康洞国;;主燃料层熵增对激光聚变点火影响的研究[A];第五届全国青年计算物理学术交流会论文摘要[C];2008年
10 肖明勇;黎杰;祁国海;;MLC-IMRT系统点剂量验证通过分析[A];中华医学会放射肿瘤治疗学分会六届二次暨中国抗癌协会肿瘤放疗专业委员会二届二次学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 记者 孙滨实习生 周丽;滚滚车轮被拽向高油价时代[N];湖北日报;2008年
2 赵治纲;新会计准则对企业利润的影响[N];财会信报;2008年
3 谭述;“五一二”地震对相关行业影响点评[N];证券时报;2008年
4 ;上市公司重大事件及其影响点评[N];证券日报;2008年
5 本版编辑 海通证券 招商证券 天相投顾 禧达丰投资 智多盈投资 安信证券;本周上市公司重大事件及其影响点评[N];证券日报;2008年
6 深圳证券交易所博士后工作站 张晓凌陈华敏;不宜夸大大型股票对股指期货的作用[N];证券时报;2007年
7 林世国;八宝井改造技术提升产量[N];长白山日报;2008年
8 黄毅诚;风电治沙 一举两得[N];中国电力报;2007年
9 山西商报 王琛;独家新闻与新闻策划[N];山西科技报;2004年
10 潘尚总(作者为浙江省局党组书记、局长);建立学习型企业才能提升竞争力[N];中国邮政报;2001年
中国博士学位论文全文数据库 前10条
1 程博;对几个统计模型的构造和数据分析[D];南开大学;2001年
2 黄梅;逐步局部影响分析及应用[D];云南大学;2010年
3 潘雄;半参数模型的估计理论及其应用[D];武汉大学;2005年
4 朱利平;回归中降维模型的估计与检验[D];华东师范大学;2006年
5 季元;分形上的热核估计和函数空间[D];清华大学;2006年
6 刘全明;非参数统计与人工智能技术在水土空间变异中的应用研究[D];内蒙古农业大学;2009年
7 王林峰;加权Laplace-Beltrami算子及相关问题研究[D];华东师范大学;2007年
8 崔霞;两类复杂数据及相关模型的统计分析[D];山东大学;2008年
9 李锋;非参和半参回归模型的稳健和截面推断[D];山东大学;2010年
10 赵鹏;条件顺序统计量和样本间隔的随机比较以及应用[D];兰州大学;2008年
中国硕士学位论文全文数据库 前10条
1 赵良渊;医用多元线性回归方程中共线影响点的诊断[D];山西医科大学;2002年
2 马振中;Cox回归比例风险假定的考察和影响点的识别及其SAS和SPSS实现[D];山西医科大学;2007年
3 王如义;多元线性回归中复共线问题及偏最小二乘回归分析[D];西南交通大学;2004年
4 庄新瑞;广义删失抽样下Weibull分布参数及几个泛函的估计[D];华中师范大学;2008年
5 赵颖;球面变换核估计及其一致收敛速度[D];北京工业大学;2001年
6 李宏海;基于椭圆族连接函数的生存分析建模[D];大连理工大学;2012年
7 文志诚;NA、PA样本下密度核估计的相合性[D];广西师范大学;2002年
8 杨路英;线性模型中误差密度的经验似然置信区间[D];广西师范大学;2005年
9 石俊芳;上证A股指数VaR模型的比较及其实证研究[D];上海海事大学;2005年
10 毛新娜;纵向数据的半参数回归模型研究[D];武汉理工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026