收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

全基因组关联分析方法的拓展以及实用分析工具软件的建立

王嘉博  
【摘要】:通过测序以及微芯片技术得到的全基因组基因型数据与表型数据间的关联分析,是探测人类疾病、农作物性状未知基因或通过已知群体基因型预测表型数据的方法。根据模型目的可以分为全基因组关联分析方法(GWAS)和全基因组预测方法(GP)两类分析方法。本研究通过对混合线性模型中随机效应分子亲缘关系矩阵的两种变形手段,发展两种全基因组预测方法:1)CBLUP通过参考群体和预测群体个体聚类压缩成组,利用组间分子亲缘关系矩阵代替个体间分子亲缘关系矩阵。通过模型似然值函数探测最佳压缩比例,进行BLUP预测;2)SBLUP通过SUPER方法对参考群体的基因型和表型进行GWAS分析,划分遗传关联区域(bin),通过模型似然值确定bin的大小和最佳的bin数量,利用筛选出来的bin创建针对性状的独特分子亲缘关系矩阵,最后在混合线性模型中进行预测。通过在模拟数据和真实数据中与GBLUP和贝叶斯LASSO方法进行对比发现,SBLUP对于简单性状(控制性状的基因数目较少)比较敏感,在这一领域具有非常大的优势,预测准确率相对于其他三种方法提高很大;CBLUP对于遗传力偏低且控制性状的基因数据比较多的性状比较敏感,在这种遗传背景下的性状具有比较大的优势,预测准确率有很好的表现。在真实数据(闽南芥、老鼠和玉米)中一共157个性状中,这两种方法只有在其中21个性状中的预测准确率没有贝叶斯LASSO高,超过比率达到了86.6%。这两种方法很好的拓展了BLUP系列方法的优势范围,从多角度解释了分子亲缘关系矩阵的构建和混合模型随机项的多元组建。在方法计算效率测试中,我们使用模拟数据扩增和真实大数据进行测试,结果展示我们的两种方法均具有较好的计算效率,计算速度比贝叶斯LASSO快,但比GBLUP要慢。结果证明在保证BLUP系列运算速度快的优势下,提高了模型预测的准确率。为人类疾病预测和动植物育种提供了高效、准确的全基因组预测新方法。本研究通过对现行世界广泛应用的全基因组关联分析工具软件(GAPIT)的重新编译,建立GAPIT第三版本,并在R语言平台实现在线调用和分析。软件主要功能包括:1)整合最新GWAS算法包括一般线性模型(GLM)、混合线性模型(MLM)、压缩式混合线性模型(CMLM)、SUPER、Farm-CPU和多位点混合线性模型(MLMM),使用户可以在一款软件中同时进行多方法的分析比较;2)将主体分析软件拆分为数据逻辑准备、数据质量控制、中间介质运算、统计分析和结果输出五个部分,这样的逻辑安排使GAPIT3可以适应第三方软件调用和输入,为未来GAPIT线上分析大数据做准备;3)多种基因型和GWAS分析结果输出,在原有GAPIT基因型和表型关联分析结果输出的基础上,增加了NJtree、3D PCA和染色体显著位点区域相关性分析等输出结果,丰富了软件分析数据的角度和结果展示。本软件已经开发完毕,现在可以通过www.zzlab.net/GAPIT使用。本研究通过对环境与基因型互作模型的开发,设计并完成了一款具有区分加性遗传效应与互作遗传效应功能的全基因组关联分析工具软件,软件通过C语言进行编译,实现了动态内存管理、二位基因型运算、多线程并行处理分析等先进大数据处理技术,对于23G的原始数据,在3个环境下总数据达到207G的情况下,依然仅仅需要4个小时就可以运行完成。同时,通过模拟数据的设置,建立了一套基因与环境模拟方法,利用不同环境下的遗传相关对整个遗传效应中加性效应和互作效应的比例进行设定,经过测试我们发现GbyE模型在互作效应占主效的情况下具有十分优越探测能力,具有十分显著的统计学强度优势,而在加性效应占主效的情况下统计学强度和纯加性效应模型保持一致,并没有丢掉统计学强度。在真实数据中,我们利用Ames和NAM两个群体的开花期性状进行分析,并通过交叉验证和其他学者的研究结果进行富集验证,结果展示,在真实数据中GbyE模型具有较好的验证,以500K为验证区间的随机富集验证率为20%左右,而我们的GbyE达到了显著的30%,以1M位验证区间的随机富集验证率为30%左右,而我们的GbyE达到了显著的40%。本软件已经开发完毕,现在可以通过www.zzlab.net/GbyE使用。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 ;韩国完成迄今最大规模人类基因组分析[J];中国科技产业;2010年04期
2 ;基因组分析具有临床应用价值[J];分子诊断与治疗杂志;2010年04期
3 王明伦;;嗜人B淋巴细胞病毒的基因组分析[J];国外医学(卫生经济分册);1988年01期
4 李伟;不用比较的基因组分析[J];世界科学;2004年06期
5 江世亮;;赵寿元教授谈“人的基因组分析”[J];世界科学;1992年05期
6 黄蓉婷;吉国力;吴小惠;;全基因组分析单核苷酸多态性对多聚腺苷化信号的影响[J];生命科学仪器;2016年Z2期
7 余光创;秦宜德;;miRNA靶基因计算分析新方法及其应用研究[J];安徽医科大学学报;2011年05期
8 郭凯声;;人类基因组分析研究在日本的进展[J];世界研究与发展;1991年05期
9 周仲儿;猪基因组分析现状[J];浙江畜牧兽医;1999年02期
10 远滕;王维荣;;人类基因组分析系统[J];世界科学;1992年05期
11 徐宁迎;奶牛基因组分析研究进展[J];中国奶牛;2000年01期
12 郭春沅;基于cDNA测序与杂交的大规模基因组分析方法[J];生物学通报;2001年08期
13 张广军;基因组分析促进解决血吸虫分子之谜[J];国外医学(寄生虫病分册);2000年05期
14 曾嘉丽;欧阳林娟;刘家林;贺浩华;朱昌兰;彭小松;贺晓鹏;傅军如;陈小荣;边建民;徐杰;孙晓棠;周大虎;胡丽芳;;水稻PAL基因的全基因组分析及胁迫表达研究[J];基因组学与应用生物学;2018年09期
15 郑媛媛;;人单个卵母细胞的基因组分析[J];中国病理生理杂志;2014年06期
16 宋文源;朱立煌;;Alu-PCR及其在人类基因组分析中的应用[J];国外医学(分子生物学分册);1992年01期
17 ;英国成立基因组分析中心,重点发展民生科技[J];中国科技信息;2009年16期
18 A.D’Hont,L.Grivent,C.Asnaghi,张琼;甘蔗基因组分析的进展[J];甘蔗糖业;1999年05期
19 祝沛平;用于基因组分析的模式植物拟南芥[J];植物杂志;2000年06期
中国重要会议论文全文数据库 前10条
1 杨晓雯;李亚杰;臧娟;李叶霞;别鹏飞;吕艳丽;吴清民;;利用泛基因组分析布鲁氏菌核心基因和必需基因[A];中国畜牧兽医学会动物传染病学分会第九次全国会员代表大会暨第十七次全国学术研讨会论文集[C];2017年
2 施定基;;微藻系统组生物学的研究[A];中国海洋湖沼学会藻类学分会第七届会员大会暨第十四次学术讨论会论文摘要集[C];2007年
3 黄发新;白石进;;适合于林木基因组分析的RAPD改进法(RAPD+sp)技术研究[A];第二届中国林业学术大会——S2 功能基因组时代的林木遗传与改良论文集[C];2009年
4 冯杰;王剑;唐兵;唐晓峰;;极端嗜盐古菌Natrinema sp.J7-2全基因组分析[A];2012年鄂粤微生物学学术年会——湖北省暨武汉微生物学会成立六十年庆祝大会论文集[C];2012年
5 冯杰;王剑;唐兵;唐晓峰;;极端嗜盐古菌Natrinema sp.J7-2全基因组分析[A];2012年第五届全国微生物遗传学学术研讨会论文摘要集[C];2012年
6 贺红霞;李楠;朱旭;李传龙;杨明贺;;马铃薯基因组编辑技术的研究进展及应用前景[A];马铃薯产业与脱贫攻坚(2018)[C];2018年
7 王冕;郝晓萌;胡媛媛;谭亿;王以光;甘茂罗;肖春玲;;基因组分析指导的海洋链霉菌IMB3-202活性物质的发现[A];第十三届全国抗生素学术会议论文集[C];2017年
8 黄军艳;韩冬梅;喻子牛;孙明;;苏云金芽胞杆菌拟步行甲亚种YBT-1765质粒pBMB175的基因组分析[A];第二届中国青年学者微生物遗传学学术研讨会论文集[C];2006年
9 郭先霞;;水稻抗病基因克隆方法及同源类似物全基因组分析[A];中国植物病理学会2006年学术年会论文集[C];2006年
10 刘大钧;;基因组分析与小麦抗病育种[A];农业科技创新与生产现代化学术研讨会论文集[C];2001年
中国博士学位论文全文数据库 前8条
1 王嘉博;全基因组关联分析方法的拓展以及实用分析工具软件的建立[D];东北农业大学;2018年
2 金科;生物信息学在大熊猫和血吸虫基因组分析中的应用[D];复旦大学;2010年
3 朱康丽;鲸类味觉的丢失及鲸类适应性进化的比较基因组学分析[D];南京师范大学;2016年
4 蔡晓锋;番茄Dof基因家族全基因组分析及SlDof22、SlDHAR1和FaGalUR在AsA积累中的功能分析[D];华中农业大学;2014年
5 胡泉军;牦牛基因组数据库建设[D];兰州大学;2014年
6 刘玉芬;鸡传染性支气管炎病毒国内分离株基因组的研究[D];东北农业大学;2003年
7 赵国昌;永久性心房颤动的基因组DNA甲基化分析[D];首都医科大学;2017年
8 杜瑾;基于基因组分析的VC发酵混菌体系共生机制及功能强化[D];天津大学;2013年
中国硕士学位论文全文数据库 前10条
1 解秀月;牦牛基因组有害突变积累研究[D];兰州大学;2018年
2 李净净;Bacillus sp.LM4-2分离鉴定与全基因组分析[D];河南科技大学;2015年
3 唐靖伟;Mucilaginibacter pedocola sp.nov.的多项分类学鉴定和基因组分析[D];华中农业大学;2017年
4 包永红;基于Hadoop的基因组分析平台构建[D];内蒙古大学;2015年
5 成竞梁;转录因子结合位点和遗传病基因突变的全基因组分析[D];湖南科技大学;2012年
6 李家红;抗重金属型锰矿假氨基杆菌JH-7~T的多相分类学鉴定和基因组分析[D];华中农业大学;2017年
7 陈露;乡村农研丝杆菌Niastella vici sp.nov.的新种鉴定及基因组分析[D];华中农业大学;2017年
8 余光创;miRNA靶基因计算分析新方法及其应用研究[D];安徽医科大学;2009年
9 包远远;矿物风化细菌的生物学特性和Dyella jiangningensis SBZ3-12全基因组分析[D];南京农业大学;2015年
10 吕萌;一株含新裂解酶的大肠杆菌噬菌体基因组测序及其裂解酶的活性检测[D];吉林大学;2015年
中国重要报纸全文数据库 前10条
1 记者 张梦然;高质量向日葵基因组“来了”[N];科技日报;2017年
2 本报记者 王洪磊 通讯员 孙哲;中德合作开创多倍体复杂基因组分析先河[N];山东科技报;2017年
3 记者 张梦然;迄今最详细的人类基因组分析数据出炉[N];科技日报;2012年
4 薛严;迄今最大规模人类基因组分析完成[N];科技日报;2010年
5 记者 赵汉斌;小麦A基因组序列精细图谱完成[N];科技日报;2018年
6 记者 白毅;两种猴基因组分析揭示遗传差异重要性[N];中国医药报;2011年
7 杨慧宁 于宛平;首次基因组分析有助认识巴西寨卡病毒暴发[N];医学参考报·灾害救援医学频道;2016年
8 记者 赵汉斌;基因组分析揭示等位基因特异RNA编辑现象[N];科技日报;2018年
9 ;“液体活检”有望用于癌症筛查[N];科技日报;2016年
10 记者 林小春;美将投10亿美元启动抗癌重大计划[N];科技日报;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978