收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

对含有缺失基因型数据的家系进行单倍型推断的EM方法

赵红  
【摘要】:在现代生物遗传学中,生物体的单倍型信息起着非常关键的作用,可以提高连锁分析和关联分析的功效和准确度,是人类得以探究基因的多样性以及定位致病基因的重要手段之一。随着科学技术的不断发展,我们已经可以得到生物体的基因型数据,但是单倍型的信息却无法直接获得。十几年来很多学者都致力于这方面的研究,发展了一系列的研究方法,其中最主要的是利用统计方法进行推断,如:Clark's算法、EM算法、Bayesian方法、基于Bayesian模型或EM方法的PL算法等等。以上的所有方法都是基于完全基因型数据而进行的单倍型推断,且没有过于详细的讨论家系数据,但是实际中的数据多是很庞大的、不完全的或是有部分缺失的,因此这些方法都不能用来很好的解决问题。 本文就是用来解决有缺失数据的多个家系的单倍型推断问题。首先,针对完全基因型的大的家系数据,利用传统的EM算法详细的给出其单倍型的推断方法,分别解决了核心家庭数据和一般的家系数据问题。在此基础之上,重点针对有缺失数据的家系进行研究,充分利用家系中个体之间的亲属关系,考虑各个核心家庭个体间的遗传制约机制。对于核心家庭中已知基因型的个体,引入Judge算子,排除不合理的双倍型向量。再利用Induce算子,为未知基因型的个体补充双倍型信息,由此得到所有个体的一切合理的双倍型向量。以此数据为基础,应用改进的EM方法得到参数的估计并得到了估计的标准差。再由极大似然的原则,分别就不同类型的个体,利用参数的估计(?)给出单倍型的推断方法.最后讨论一个简单的例子,即同胞对家系数据。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吕王勇;吴耀国;马洪;;基于EM算法的对数正态分布参数估计[J];统计与决策;2007年12期
2 王娜;李新海;;关于对数正态分布参数极大似然估计的讨论[J];北华大学学报(自然科学版);2007年05期
3 张香云;张秀伟;;基于EM算法隐Markov模型参数估计[J];大学数学;2008年03期
4 田玉柱;何建伟;陈平;;带截尾数据的混合广义指数分布的参数估计[J];重庆工学院学报(自然科学版);2008年10期
5 王泽文;奇异值检验中的混合模型及EM算法[J];武汉大学学报(信息科学版);1990年01期
6 孙晓武,陈启光;不完全资料下logistic回归模型参数估计的EM算法[J];数学的实践与认识;1994年02期
7 郑明,杨艺,郑宇;基于分组数据的Weibull分布的参数估计[J];高校应用数学学报A辑(中文版);2003年03期
8 王源,陈亚军;基于高斯混合模型的EM学习算法[J];山西师范大学学报(自然科学版);2005年01期
9 谢勤岚;;基于EM算法的混合模型的参数估计[J];计算机与数字工程;2006年12期
10 杨明;韩琳;;具有正确收敛性的EM算法在电子政务中的应用[J];鲁东大学学报(自然科学版);2007年02期
11 马志明;刘瑞元;习丽;;多个子总体混合分布的参数估计[J];西北民族大学学报(自然科学版);2007年01期
12 陈轲;归庆明;魏萌;柳丽;刘园园;;t型抗差估计及其在测量平差中的应用[J];测绘科学技术学报;2008年01期
13 张香云;张秀伟;;不同缺失率下EM算法的参数估计[J];数理统计与管理;2008年03期
14 陈轲;归庆明;柳丽;刘园园;;Gauss-Markov模型的t型抗差估计[J];测绘学报;2008年03期
15 刘宝亮;温艳清;马珽;;有限混合模型的参数估计[J];山东理工大学学报(自然科学版);2008年05期
16 田玉柱;王丙参;陈平;;混合广义指数分布的参数估计[J];江西师范大学学报(自然科学版);2009年03期
17 孔怡青;王士同;;半监督学习贝叶斯分类(英文)[J];广西师范大学学报(自然科学版);2006年04期
18 纪志荣;黄可明;;基于EM算法的无失效数据的参数估计[J];福州大学学报(自然科学版);2007年04期
19 李兆勤;赵天玺;;指数分布中参数估计的两类错误概率的EM算法[J];长春大学学报;2007年08期
20 菅小艳;;基于不完整数据的EM算法初值选取[J];太原师范学院学报(自然科学版);2010年01期
中国重要会议论文全文数据库 前10条
1 王泽生;廖剑华;陈美元;曾伟;宋思扬;;双孢蘑菇杂交菌株As2796家系的分子遗传研究[A];全国第6届食用菌学术研讨会论文集[C];2001年
2 李晓侨;孟岩;王铮;彭园园;佃艳;黄尚志;;两个HSP家系的致病基因定位以及突变鉴定[A];第八次全国医学遗传学学术会议(中华医学会2009年医学遗传学年会)论文摘要汇编[C];2009年
3 王恒;;近亲结婚一家系两代6例癫痫大发作报告[A];’96全国优生科学大会大会学术讲演与大会论文摘要汇编[C];1996年
4 梁华;邹庆玲;刘长生;陈杰;;性连锁Alport综合征一家系COL4A5基因突变检测[A];“中华医学会肾脏病学分会2004年年会”暨“第二届全国中青年肾脏病学术会议”论文汇编[C];2004年
5 宫怡;杨建军;张宁;关光玉;胡庆和;;强直性脊柱炎-回族家系的调查及基因分析[A];第六届中国中西医结合风湿病学术会议论文汇编[C];2006年
6 陈晓阳;李吉跃;彭祚登;李悦;;油松耐旱性育种及改良技术[A];持续发展,再创辉煌——中国林学会林木遗传育种分会第五届年会文集[C];2002年
7 田娟;郑芳;;两例先天性肾上腺皮质增生症家系的分子诊断[A];中华医学会第九次全国检验医学学术会议暨中国医院协会临床检验管理专业委员会第六届全国临床检验实验室管理学术会议论文汇编[C];2011年
8 朱光明;张微微;李莹;;几个CADASIL家系Notch3基因突变的研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
9 黄文;张成;陈松林;张为西;卢锡林;;缺失型DMD家系女性携带者的基因诊断[A];中华医学会第七次全国神经病学学术会议论文汇编[C];2004年
10 刘静宇;任翔;王秀凤;郭唐英;蔡周;代小华;王旭;唐朝晖;刘木根;王擎;;在一个X-连锁眼球震颤的中国家系中发现新的GRP143基因突变[A];湖北省遗传学会、江西省遗传学会2006年学术年会暨学术讨论会论文摘要集[C];2006年
中国博士学位论文全文数据库 前10条
1 郑术蓉;线性不等式约束下的EM算法[D];吉林大学;2004年
2 邹海东;孔源性视网膜脱离的人群流行病学调查和易感基因初步筛选[D];复旦大学;2005年
3 叶胜难;非综合征常染色体显性遗传性聋家系的基因定位研究[D];军医进修学院;2001年
4 高永平;平安村的财产继承[D];中国人民大学;2005年
5 JIXIANG WU;[D];浙江大学;2001年
6 吴斌;“证候-基因组”的方法学及家系虚寒证的代谢基因表达谱研究[D];成都中医药大学;2005年
7 裴卫东;家族性混合型高脂血症家系分子遗传流行病学研究[D];中国协和医科大学;1999年
8 孙晓梅;日本落叶松纸浆材优良家系选择及家系生长模型的研究[D];中国林业科学研究院;2003年
9 代礼;出生缺陷家系收集及并指(趾)多指(趾)畸形的HOXD13基因突变分析[D];四川大学;2004年
10 杨文杰;中国汉族人群原发性高血压和LPL、ADD1、AT1、VAPR1A基因的连锁和关联研究[D];中国协和医科大学;2003年
中国硕士学位论文全文数据库 前10条
1 赵红;对含有缺失基因型数据的家系进行单倍型推断的EM方法[D];东北师范大学;2006年
2 丁春忠;学生成绩评价中的因子分析[D];苏州大学;2004年
3 韩雄振;基于统计学的预测结构域间相互作用方法的研究[D];吉林大学;2006年
4 涂庆;中小样本的拟合优度检验[D];华中师范大学;2007年
5 刘妍;混合连接函数模型及其在风险度量中的应用[D];中国人民大学;2008年
6 韩琨;针对远交林木群体构建连锁不平衡图谱[D];浙江林学院;2008年
7 林鸿;EM算法的改进及其在基因序列分析中的应用[D];福州大学;2006年
8 孙兰;有限混合模型及其应用的研究进展[D];东北师范大学;2006年
9 茹正亮;基于状态空间模型的金融时间序列预测方法[D];河海大学;2007年
10 张智勇;基于GMDH的缺失数据插补方法研究[D];四川大学;2007年
中国重要报纸全文数据库 前10条
1 袁立新;深圳发现罕见“多指并指”家系[N];中国医药报;2001年
2 王忠明;晚间,7时半至9时半(下)[N];大众科技报;2003年
3 王忠明;晚间,7时半至9时半(上)[N];大众科技报;2003年
4 记者 苑海震 通讯员 魏妍平;我省确诊一例致死性失眠症患者[N];河南日报;2006年
5 ;中国古代及近代名画、家系列[N];经济日报;2001年
6 衣晓峰 李华虹;我国发现新的先天性白内障家系致病基因[N];中国中医药报;2004年
7 衣晓峰;李华虹;我国发现先天性白内障家系新致病基因[N];中国医药报;2004年
8 袁立新;深圳发现 “眼耳肾综合征”罕见家系[N];大众卫生报;2002年
9 湖南省林木品种审定委员会 供稿;五个火炬松纸浆材家系[N];湖南科技报;2008年
10 记者 黎蘅 通讯员 葛峰;35个孤独症家系 5个发现基因缺失[N];广州日报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978