基于表型测序的功能基因识别
【摘要】:下一代测序技术在近年发展迅速,通量增加的同时成本也在下降。通过下一代测序,识别和鉴定与表型有关的功能基因,被称作表型测序。表型测序方法,需要进行测序、序列比对、突变识别、突变筛选和功能基因识别等分析流程,但有许多因素影响着表型测序的成功,例如测序质量较低,测序深度较低,突变识别和筛选的参数过于严格等等。对研究者而言,如何衡量这些因素对实验的影响、如何优化表型测序分析流程并以较大的概率识别出与表型控制相关的功能基因,还是非常困难的事情。本研究统筹考虑整个表型测序分析流程和真实实验数据,建立了基于突变检测灵敏度和特异度的概率框架,并计算出识别与表型相关的基因的概率、随机被挑作候选基因的基因数目、候选基因与表型相关的显著性、如果没有找到候选基因或者候选基因被验证为假阳性时,结果违背单基因假说的显著性;并将之开发成名为GIPS (Gene Identification via Phenotype Sequencing)的软件包,软件包下载、算法手册、源代码详见网站。根据输出结果,研究人员可以优化表型测序分析流程,增加识别出与表型控制相关的功能基因的概率和准确度。本研究将真实数据和模拟数据应用GIPS。首先讨论了突变识别参数中测序深度、碱基质量等因素对突变识别灵敏度的影响。此外在歌舞伎综合征研究中,成功的将与表型相关的基因MLL2识别为候选基因,并排名第二位;在水稻缺磷表型研究中,成功的将与表型控制相关的磷转运基因识别为唯一的候选功能基因;在先天性子宫阴道缺如综合征研究中,通过计算的方法得出先天性子宫阴道缺如综合征表型的发生可能由多基因或者非编码区基因突变导致的结论。网址:https://github.com/rlibs-zju/gips/wiki
|
|
|
|
1 |
刘清萍,刘中华,唐新科,陈平,梁宋平;串联质谱在多肽测序中的应用[J];生命科学研究;2004年02期 |
2 |
张文力;;高通量测序数据分析现状与挑战[J];集成技术;2012年03期 |
3 |
李黎;;一种简化的质粒DNA快速测序法[J];国外医学(分子生物学分册);1991年03期 |
4 |
卢春,陈溥言,蔡宝祥,王俊;一种纯化双链DNA测序模板的有效方法[J];生物技术;1996年04期 |
5 |
童大跃,伍新尧,蔡贵庆,李建金,刘秋玲;线粒体DNA高变区hν1快速测序方法及应用[J];生物技术通讯;2003年04期 |
6 |
许艳,卫红飞,胡小平,包木胜,王爱丽,程岩,王丽颖;DNA自动测序中的常见影响因素及测序反应体系的优化[J];吉林大学学报(医学版);2004年06期 |
7 |
刘力,庄志雄,陈雯,杨杏芬,凌文华,魏青,邓丽霞;应用连接介导PCR法于线粒体DNA的测序[J];中国职业医学;2000年03期 |
8 |
肖翠英,张思,仲武辉,夏庆杰;DNA自动测序中几种影响因素的研究[J];中华医学遗传学杂志;1998年04期 |
9 |
甄志成,姚志建;毛细管阵列电泳与规模化DNA测序[J];色谱;2001年04期 |
10 |
余才林;大规模DNA测序进展[J];国外医学.遗传学分册;1996年02期 |
11 |
袁汉英,李纹,李育阳;一种简便的双链DNA测序法[J];遗传;1996年06期 |
12 |
王红霞,何昆,李卫华,魏开华,王杰,杨松成,张学敏;部分结构特殊多肽的纳升电喷雾串联质谱测序分析[J];军事医学科学院院刊;2003年01期 |
13 |
方勤,田静;双链DNA模板循环测序的研究[J];生物技术;1999年05期 |
14 |
张鑫;李敏;张学军;;全基因组外显子测序及其应用[J];遗传;2011年08期 |
15 |
陈晓蕾;;DNA测序风云录[J];科技创业;2011年07期 |
16 |
王博飞;梁晓媛;杨林森;;微生物测序分型系统——基于美国应用生物系统公司基因分析仪的MicroSeq~微生物鉴定系统[J];微生物与感染;2008年03期 |
17 |
张晓红;李发根;王宇;徐立安;李梅;甘四明;;桉树EST-PCR产物测序方案的优化[J];基因组学与应用生物学;2009年03期 |
18 |
金鑫燕;;动物mtDNA标记的研究方法与应用[J];青海畜牧兽医杂志;2006年02期 |
19 |
王中胜;朱云平;贺福初;;肽序列从头测序算法[J];军事医学科学院院刊;2006年05期 |
20 |
张莉君;王先良;孙晞;徐顺清;;改进的亚硫酸氢钠测序法检测HepG2 RASSF1A基因CpG岛甲基化状态[J];华中科技大学学报(医学版);2006年03期 |
|