收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

线性不等式约束下的EM算法

郑术蓉  
【摘要】:不完全数据(包括缺失数据、潜在数据等)问题的研究和半序约束下的统计推断都是统计学中重要的研究领域,广泛地应用于工程学、生物学、医药学、经济学和社会科学。在很多情况下这两类问题是同时出现的,因此对它们同时进行研究具有很强的应用背景和实际意义。 对于不完全数据问题的研究中EM算法是求解极大似然估计的一种强有力的算法。EM算法最基本的思想来自遗传学家估计ABO血型的基因频率,即“gcne-counting method”。由Dempster,Laird and Rubin(1977)提出的EM算法是一种迭代算法,在每次迭代中又分为两步;E步和M步,即期望步(Expectation Step)和最大化步(Maximization Step)。 EM算法自提出以来,许多统计学家对它的发展和推广做出了很大的贡献(Mclachlan et al.,1997).Walker(1996)提出利用Montc Carlo的方法,例如MCMC或重要性抽样的方法解决EM算法E步的计算问题。Meng and Rubin(1993)提出了ECM算法,基本的思路是用条件最大化CM步代替EM算法中的M步,从而达到简化的目的。Liu and Rubin(1994)提出了ECME算法,建议用条件最大化不完全似然代替ECM算法中的部分CM步,因此是ECM算法的一种推广。Fessler and Hcro(1994)提出了SAGE算法,其想法 吉林大学博士学位论文 线性不等式约束下的EM算法 是把参数向量分割为几个子参数向量·Meng and van Dyk(1995)把ECME 和SAGE算法结合在一起得到了AECM算法. 自二十世纪五十年代以来,半序约束下的参数估计间题的研究取得了很 大的发展,现在仍然有很多人致力于这方面的研究.半序约束形式是多种多样 的,并且根据不同的形式往往可以建立针对性很强的统计方法,详见B arlow, Bartholomew,Brenner and Brunk(1972)和Robertson,Wright and Dykstra (1988)两本书.2002年Journal of Statistieal planning and Inferenee设立 专刊讨论近几十年来这方面的工作.GaoandShi(2003),和Shiandzheng (20叫讨论了列联表中参数在半序约束下的极大似然估计.但这些问题本身都 可以用一种很简单的形式表达出来,即A。口全0,其中A。是一个已知矩阵, 月是被约束的向量.这种表示的一个自然推广是A。口之a,其中a可以是一个 不为零的向量,称为一般的线性不等式约束.当AO月=a时,称这种约束为 线性等式约束. 尽管一些研究人员已经对含缺失数据的参数约束估计间题进行了讨论, 例如Kim andTaylor(1995)在J.A.S.A上讨论了缺失数据间题中参数在线性 等式约束下的参数估计问题;Razzaghi and Kodell(2000)在Biometries上 得到了含缺失数据问题中一种很特殊情况下的非线性等式约束估计,从而解 决了药物剂量反应中定量反应的风险评价间题.但是如前所说,对AO口七a 这种线性不等式约束情况下的统计推断间题的研究具有更广泛的应用背景和 实际意义.很显然,Kim andTa夕lor(1995)的方法不适用于这种更一般的间 题.并且Meng and Rubin(1993)和Liu and Rubin(1994)关于EM算法中 M步的改进也均不适用于这个问题. 基于以上原因,本文提出了线性不等式约束下的EM算法,针对线性模 型,混合线性模型和广义混合线性模型特别是Logistic模型进行了讨论,给出 了关于线性不等式约束EM算法系统的理论和方法.本文分为五章:第一章 吉林大学博士学位论文 线性不等式约束下的EM算法 介绍与本文相关的必要知识和有关结果;第二章讨论含缺失数据的线性模型 中参数被线性不等式约束时的统计推断问题.令线性模型为 Y二X口+氏 (1) 其中误差。、N(0,功,数据Y出现部分缺失,参数尽受线性不等式A声七a 的约束.本章讨论了方差艺已知条件下参数口在线性不等式约束下的统计推 断间题,提出了线性不等式约束EM算法,证明了算法的收敛性和所得估计 的相合性并解决了一个相关的检验间题;第三章讨论含缺失数据的线性模型 (l)中讨厌参数存在时感兴趣的参数在线性不等式约束下的统计推断间题;第 四章讨论含缺失数据的混合线性模型中参数在线性不等式约束下的统计推断 间题;第五章讨论含缺失数据的广义混合线性模型特别是Logistic模型中参 数在线性不等式约束下的统计推断问题.主要结果如下: (一)线性模型(l)中参数口受线性不等式约束且方差阵E已知时的 约束EM算法.假定(Y,,…,Y动是模型(l)的一个大小为n的样本,并有 部分缺失,我们关心的间题是口在线性不等式AO月全a约束下的统计推断问 题,其中A。是一个事先给定的矩阵,艺是已知的方差阵. 直接由观测似然出发去寻找口在线性不等式约束下的极大似然估计是非 常困难的.由于完全数据的似然函数具有较简洁的形式,于是利用EM算法给 缺失数据补值来求解这个间题,但是遇到的困难是参数被一些线性不等式约 束.尽管Kim and Taylor(2001),Razzaghi and Kodell(2000)也研究T约束 下的EM算法,但是他们仅对等式约束进行了研究,而线性不等式约束由于具 有更大的难度一直没有被解决.本文的第二章解决了这个问题,提出了线性模 型中的线性不等式约束EM算法.在M步中利用一般化了的Kudo(1963) 的算法(我们已在文中给出了解的充要条件、解的显示表达式及证明并给出了 相应的算法)


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 沈启霞;刘心声;;含缺失数据线性模型回归系数的约束EM算法[J];南京大学学报数学半年刊;2007年01期
2 田萍;张屹山;;缺失数据下ARMA(1,1)模型的估计方法[J];中国管理科学;2008年02期
3 游晓锋;丁树良;刘红云;;缺失数据的估计方法及应用[J];江西师范大学学报(自然科学版);2011年03期
4 朱耀生;赵守娟;;一类不完全纵向数据的统计推断[J];新乡学院学报(自然科学版);2011年03期
5 李开灿;;有缺失数据的META-MARKOV模型的局部计算[J];应用数学学报;2007年03期
6 菅小艳;;基于不完整数据的EM算法初值选取[J];太原师范学院学报(自然科学版);2010年01期
7 张香云;张秀伟;;基于EM算法隐Markov模型参数估计[J];大学数学;2008年03期
8 陈晓林;汪四水;;一类混合正态分布参数估计的EM算法和数据扩张[J];苏州大学学报(自然科学版);2007年03期
9 赵红;朱文圣;郭建华;;对含未知基因型个体的家系进行单倍型推断的EM方法[J];应用概率统计;2009年04期
10 杨珂玲;韩慧芳;;两混合正态分布的参数估计方法[J];黄冈师范学院学报;2006年03期
11 吕王勇;吴耀国;马洪;;基于EM算法的对数正态分布参数估计[J];统计与决策;2007年12期
12 王娜;李新海;;关于对数正态分布参数极大似然估计的讨论[J];北华大学学报(自然科学版);2007年05期
13 田玉柱;何建伟;陈平;;带截尾数据的混合广义指数分布的参数估计[J];重庆工学院学报(自然科学版);2008年10期
14 茹正亮;高安力;;EM算法在不完全数据参数估计中的应用[J];南京工程学院学报(自然科学版);2008年04期
15 王泽文;奇异值检验中的混合模型及EM算法[J];武汉大学学报(信息科学版);1990年01期
16 孙晓武,陈启光;不完全资料下logistic回归模型参数估计的EM算法[J];数学的实践与认识;1994年02期
17 郑明,杨艺,郑宇;基于分组数据的Weibull分布的参数估计[J];高校应用数学学报A辑(中文版);2003年03期
18 王源,陈亚军;基于高斯混合模型的EM学习算法[J];山西师范大学学报(自然科学版);2005年01期
19 谢勤岚;;基于EM算法的混合模型的参数估计[J];计算机与数字工程;2006年12期
20 杨明;韩琳;;具有正确收敛性的EM算法在电子政务中的应用[J];鲁东大学学报(自然科学版);2007年02期
中国重要会议论文全文数据库 前10条
1 丁向东;张勤;;基于EM和规则算法的半同胞家系单倍型推断方法[A];中国动物遗传育种研究进展——第十五次全国动物遗传育种学术讨论会论文集[C];2009年
2 马尽文;何学锋;;高斯混合模型的数据尺度可压缩参数学习算法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
3 赵扬;马尽文;;退火EM算法在非监督图像分割中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
4 骆俊;马尽文;;高斯混合模型的遗传分基融合算法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
5 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
6 路晶;马少平;;基于多例学习的web图像聚类[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
7 王彪;王成儒;王芬芬;;一种改进的运动目标检测算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 韩玉兵;殷玮玮;吴乐南;;基于Wavelet-HMM的图像超分辨率重建[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
9 向礼;苏宝库;;一种改进高斯混合粒子滤波器在状态估计中的应用[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
10 李旭超;朱善安;;WCS-HMT模型在图像分割中的应用[A];2006中国控制与决策学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 郑术蓉;线性不等式约束下的EM算法[D];吉林大学;2004年
2 张文专;非线性再生散度随机效应模型的统计分析[D];云南大学;2004年
3 吴茗;非简单随机抽样下的一些统计推断问题[D];华中师范大学;2011年
4 罗季;有限混合分布模型与线性模型的估计和检验问题[D];华东师范大学;2008年
5 邓柯;图和词典模型的统计方法及应用[D];北京大学;2008年
6 程从华;生存分析中删失数据统计推断及其应用[D];兰州大学;2011年
7 贾俊杰;空间数据挖掘中若干关键技术研究[D];长安大学;2009年
8 赖欣;对随机效应混合治愈模型的一些推广[D];中国科学技术大学;2009年
9 孙红杰;基于主动测量的网络性能分析[D];哈尔滨工业大学;2007年
10 陈佐;时间序列相空间重构数据挖掘方法及其在证券市场的应用[D];湖南大学;2007年
中国硕士学位论文全文数据库 前10条
1 林鸿;EM算法的改进及其在基因序列分析中的应用[D];福州大学;2006年
2 张智勇;基于GMDH的缺失数据插补方法研究[D];四川大学;2007年
3 冉延平;基于混合模型的聚类算法及其稳健性研究[D];中国人民解放军信息工程大学;2005年
4 孙佳瑜;有缺失数据的AR(1)模型参数的估计方法[D];东北师范大学;2008年
5 陈婷;基于EM算法的含缺失数据的参数估计[D];大连理工大学;2008年
6 赵红;对含有缺失基因型数据的家系进行单倍型推断的EM方法[D];东北师范大学;2006年
7 朱耀生;临床医学研究中带有缺失数据和截断数据的统计推断方法[D];东北师范大学;2006年
8 尹吉平;具有数据缺失森林资源预测的研究[D];南京林业大学;2009年
9 安源;控制人口分层下的复杂疾病基因的关联检验[D];黑龙江大学;2008年
10 沈启霞;含缺失数据的线性模型回归系数的约束EM算法[D];南京航空航天大学;2007年
中国重要报纸全文数据库 前10条
1 刘若帆宋林;诗邦金A6+1:凭借其质提高其量[N];农资导报;2008年
2 刘苏华宋林;树品牌 拓市场 求实效[N];中华合作时报;2008年
3 俞建拖;发展的天空其实非常高远[N];上海证券报;2008年
4 记者 刘苏华特约记者 宋林;金沂蒙生态肥业召开2008经销商年会[N];农资导报;2008年
5 崔昕;带着经验前行[N];中国医药报;2005年
6 姜明;天津:万名职工评工会[N];工人日报;2005年
7 中央财经大学财经研究所 王卉彤;社会资本与民间金融可良性互动[N];证券日报;2005年
8 李培林;我国当前社会存在的潜在问题及其分析[N];中国社会科学院院报;2004年
9 唐旭;金融研究要有科学的方法[N];金融时报;2005年
10 记者 鲁仪诗;佛山陶企又遭巴基斯担反倾销[N];民营经济报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978