收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于二代测序的基因组结构变异仿真与应用研究

高美虹  
【摘要】:随着近年来二代测序的快速发展,许多检测算法被证明可以用来识别基因组结构变异,基因组结构变异的仿真和符合真实测序特性的序列的生成可以为这些检测算法提供一个必要的基准。基因组结构变异和单位点变异占人类基因组变异的绝大部分,在人类基因组序列中仿真这些变异可以为变异检测和比对算法的性能评估提供答案。由于结构变异的复杂性和真实测序数据读段生成的不确定性,想要捕获真实的测序特征并实现仿真并不容易,目前存在的仿真算法都不能模拟与实际测序数据相关的所有特征。为了克服这个限制,本文提出一个新的仿真算法SVSR。它整合了与主要基因组变异和真实测序数据相关的多个重要特征,可以模拟单位点变异和五种常见的基因组结构变异(插入缺失、串联重复、拷贝数变异、倒位和易位),并生成基于四种主流测序平台(Illumina、Solid、Roche 454及Ion Torrent)的测序数据。SVSR的实现包括以下两个部分:(1)提出了一种新的基于基因组结构变异的仿真算法。采用变异热点分布模型、选择模型和肿瘤异质性模型对多种复杂基因组变异进行建模分析。第一,对单位点变异进行仿真。分析了变异的热区分布、纯合杂合比和转换颠换比。第二,对短序列插入缺失变异进行仿真。分析了变异的热区分布、三种变异长度indel分布、变异种类及插入数据的不同来源。第三,对拷贝数变异进行仿真。分析了变异状态之间的转移概率,采用选择模型来确定概率值。第四,对串联重复进行仿真。采用两个复制规则来生成串联重复序列。第五,对倒位和易位进行仿真。模拟了常见的倒位和易位,根据需求对特定的变异进行仿真。综合以上变异仿真部分,可以对生殖细胞变异和体细胞变异进行模拟,生成符合特定要求的异质性肿瘤序列。(2)提出了一种新的基于真实测序数据的序列生成算法。采用质量值分布模型和GC偏移模型对特定肿瘤纯度的序列生成过程进行建模分析,生成正常样本和肿瘤多样本测序序列。第一,确定读段长度、插入尺寸、测序深度等测序信息。针对不同测序平台确定特定的测序信息值。第二,对测序质量值分布和测序错误进行分析。SVSR通过训练各测序平台的真实数据来确定质量值的分布,通过一个错误模型对真实测序错误率进行模拟。第三,对GC偏移进行分析。GC偏移是指测序读段数较测序深度发生的偏离程度,这是由DNA片段GC含量的变化所导致,SVSR用一个线性关系来模拟这个偏离程度。在读段生成时,通过训练真实数据的质量分布,设置合适的特征值,最后生成特定的正常样本、肿瘤样本或正常样本和肿瘤样本混合的测序序列。综上,SVSR是一个集变异仿真和序列生成为一体的功能强大的仿真工具,它可以仿真发生多种变异的正常样本和肿瘤样本,并生成相关平台的测序数据。通过分析实验结果可知,SVSR可以在合理的测序质量范围内仿真更加真实的数据特性,并且拥有众多优势:(1)仿真变异类型多(六种基因组变异);(2)模拟了了变异热点分布、纯合杂合比及转换颠换比;(3)考虑了插入数据的不同来源;(4)模拟了肿瘤异质性和肿瘤纯度;(5)模拟了测序过程中的GC偏移和测序质量分布等。总而言之,SVSR在模拟复杂的结构变异和生成各种测序读段方面具有独特的功能,它可以用作现有仿真算法的补充,也可以作为变异检测和比对算法的基准。这有助于用户选择合适的方法实现需求,并帮助研究人员基于对现有方法缺点的理解,开发功能更强大的变异检测和比对算法。


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 张宝月;;稀有样本单细胞测序技术取得进展[J];生物医学工程与临床;2020年01期
2 李法君;;降解组测序技术及其研究进展[J];生物学教学;2017年04期
3 彭桂兰;陈嘉慧;荣丹箐;;第四代测序技术[J];农村经济与科技;2017年10期
4 王海;;高通量测序技术新名词的理解和辨析[J];中国科技术语;2017年04期
5 权冰娥;李树;;新一代DNA测序技术在法医实践中的应用及其研究进展[J];辽宁警察学院学报;2017年06期
6 郑秋燕;李清;毛华明;冷静;;测序技术的发展对瘤胃元基因组研究的影响[J];黑龙江畜牧兽医;2015年21期
7 韩齐;李媛媛;孙方达;孔保华;陈倩;;新一代测序技术在食品微生物学中的应用[J];食品工业;2016年01期
8 杜兵兵;;第二代高通量测序技术的原理及其在医学中的应用进展[J];中国继续医学教育;2016年03期
9 周莹;许冰莹;;二代测序技术在临床医学上的相关应用[J];昆明医科大学学报;2016年03期
10 乌日拉嘎;徐海燕;冯淑贞;孙志宏;孟和毕力格;张和平;;测序技术的研究进展及三代测序的应用[J];中国乳品工业;2016年04期
11 郭海燕;程国虎;李拥军;张昊;秦康乐;;高通量测序技术及其在生物学中的应用[J];当代畜牧;2016年12期
12 史子学;王秀杰;;高通量测序技术应用于猪病检测的探讨[J];猪业科学;2016年07期
13 张丁予;章婷曦;王国祥;;第二代测序技术的发展及应用[J];环境科学与技术;2016年09期
14 郭俊;李小燕;蔡伦;王绿娅;杜杰;;医学研究生"高通量测序技术"应用能力的培养[J];现代生物医学进展;2016年31期
15 杜玲;刘刚;陆健;刘丑生;哈福;;高通量测序技术的发展及其在生命科学中的应用[J];中国畜牧兽医;2014年12期
16 张媛;肖霞;张俊红;齐力旺;韩素英;;落叶松干细胞发育模型研究中的高通量测序技术[J];生物产业技术;2013年04期
17 周贝贝;刘立;黄彦;肖华胜;;新一代测序技术及其产业化前景[J];生物产业技术;2013年04期
中国重要会议论文全文数据库 前10条
1 张静;秦笙;李娟;刘娜;候成香;李木旺;;家蚕雏翅(minute wing)发生的转录组分析[A];江苏省遗传学会2016年学术年会论文摘要集[C];2016年
2 张明超;刘帅妹;李卫巍;夏欣一;李晓军;崔英霞;;用捕获芯片结合下一代测序技术对常染色体显性遗传多囊肾患者进行遗传学诊断[A];江苏省遗传学会2016年学术年会论文摘要集[C];2016年
3 赵洁;赵志军;贾伟;师志云;赵颖;张玉英;赵玥;魏军;;新一代测序技术及其应用[A];第三届中国临床微生物学大会暨微生物学与免疫学论坛论文汇编[C];2012年
4 何彪;涂长春;;下一代测序技术的应用及展望[A];中国畜牧兽医学会家畜传染病学分会第八届全国会员代表大会暨第十五次学术研讨会论文集[C];2013年
5 柳延虎;王璐;于黎;;单分子实时测序技术的原理与应用[A];遗传多样性:前沿与挑战——中国的遗传学研究(2013-2015)——2015中国遗传学会大会论文摘要汇编[C];2015年
6 康良;李雪;李梦;;单细胞测序技术在运动戒毒中的应用展望[A];第十一届全国体育科学大会论文摘要汇编[C];2019年
7 赵玥;赵志军;贾伟;师志云;;454高通量测序技术及其在临床上的应用[A];第三届中国临床微生物学大会暨微生物学与免疫学论坛论文汇编[C];2012年
8 李晓峰;刘公社;;利用454测序技术大规模挖掘羊草抗逆转录因子的研究[A];中国草学会牧草育种委员会第七届代表大会论文集[C];2009年
9 古其会;吴清平;张菊梅;吴慧清;孙铭;;高通量测序技术在饮用水微生物多样性研究中的应用[A];中国食品科学技术学会第十三届年会论文摘要集[C];2016年
10 杨刚;吴镝;张娟;张丽芳;马多;蒋丽娜;李梦龙;文志宁;;统计学方法在mRNA-Seq中的应用[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
中国博士学位论文全文数据库 前10条
1 邹远;核酸单分子操控和单细胞测序[D];厦门大学;2017年
2 王景;16S rRNA基因二代测序中的测序深度与测序错误对微生物群落多样性分析的影响[D];上海交通大学;2018年
3 初砚硕;基于肿瘤测序数据的亚克隆重构方法研究[D];哈尔滨工业大学;2019年
4 宣金锋;Y染色体遗传标记在法医学中的应用研究[D];中国医科大学;2019年
5 朱家楼;泌尿系统相关肿瘤基因组学研究[D];武汉大学;2017年
6 陈科;二代测序平台进行核酸检测的新技术研究[D];东华大学;2018年
7 Arslan Mehboob;利用转录组测序技术研究鸡lambda干扰素在鸡细胞及器官中介导的免疫信号通路[D];中国农业科学院;2019年
8 平捷;高通量测序技术在个性化医疗中的应用[D];上海交通大学;2012年
9 谢为博;基于表达谱芯片和新一代测序技术的高通量基因分型方法的开发[D];华中农业大学;2010年
10 林强;应用第二代高通量测序技术研究哺乳动物转录组以及转录调控机制[D];中国科学院北京基因组研究所;2011年
中国硕士学位论文全文数据库 前10条
1 王骏;基于深度测序技术的柑桔衰退病毒新基因型鉴定研究[D];西南大学;2019年
2 靳柯;基于双线性回归的单细胞测序数据去噪算法研究[D];华中师范大学;2019年
3 瞿锡垚;高通量全长转录组测序数据的表达水平计算研究[D];南京航空航天大学;2019年
4 程小芳;基于共标签标记的单管长片段测序技术研发[D];华南理工大学;2019年
5 高美虹;基于二代测序的基因组结构变异仿真与应用研究[D];西安电子科技大学;2019年
6 刘娇;采用高通量测序筛选MC4R下游基因表达谱及验证[D];郑州大学;2019年
7 方银瑞;基于Hadoop平台的下一代测序数据处理算法研究[D];西北农林科技大学;2019年
8 周佩霞;面向第三代测序技术的基因组长序列片段比对算法研究[D];湖南师范大学;2019年
9 柴贵娟;基于高通量测序技术对喉癌相关长链非编码RNA的初步筛选及鉴定[D];吉林大学;2019年
10 李盛源;新一代高通量测序数据校正方法研究[D];哈尔滨工程大学;2018年
中国重要报纸全文数据库 前10条
1 本报记者 刘丹;纳米测序商业化在即[N];中国科学报;2012年
2 李响 李金山;新单细胞DNA甲基化测序技术可应用于不同物种[N];中国科学报;2019年
3 记者 罗晨;“下一代测序技术”发力食品检测[N];中国食品报;2019年
4 记者 王潇雨;测序技术联手捕获肝癌免疫状态[N];健康报;2019年
5 记者 张梦然;测序技术找到16世纪灾难性流行病罪魁祸首[N];科技日报;2018年
6 本报记者 孙玉松;基因快捷测序,服务更多“朱莉”们[N];科技日报;2018年
7 中国妇女报·中华女性网记者 刘月辉 富东燕;朱岩梅:基因科技造福人类[N];中国妇女报;2017年
8 记者 刘海英;83个罕见基因变异可显著影响身高[N];科技日报;2017年
9 记者 王思琪 王悦;基因检测上游壁垒高筑[N];第一财经日报;2017年
10 胡阳 本报记者 沈洪;瞄准“改变世界的技术”[N];中国质量报;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978