收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

单体型和基因型问题的优化模型和算法

汪颖  
【摘要】: 单核苷酸多态性(SNP)是人类基因组DNA序列变异的主要形式,是决定人类疾病易感性和药物反应性差异的核心信息。在SNP位置上的核苷酸称为等位基因(allele)。对于人类而言,位于一条染色体上某个区域上的一组等位基因称作单体型(haplotype),而位于一对染色体上某个区域的由成对的等位基因构成的序列称作基因型(genotype)。许多研究表明在预测、研究复杂疾病方面,单体型所携带的信息比单个的SNP或基因型数据的信息多得多。但是在现有实验条件下要获得单体型非常困难,而获得基因型数据或SNP数据却很容易,因此本文主要是利用SNP数据和基因型数据来研究单体型的重构问题以及带有基因信息的单体型重构问题。另外,实验数据中经常会遇到缺失现象和冗余现象,而这些现象在疾病关联研究中会阻碍进一步的分析和研究,因此又对这些问题进行了讨论。本论文主要是从数学优化的角度着手,针对单体型、基因型的相关问题建立优化模型并构造优化算法,目的是利用计算的手段更好地探究这些问题。本论文从以下三个方面进行论述: (1)在第三章中,分别对单体型重构问题中的最少错误纠正(MEC)问题和带有基因信息的单体型重构(HRG)问题建立了数学优化模型,并证明了模型的一些性质,如可行域的非空性、目标函数的有界性和最优解的存在性,最后又分别构造了两种启发式算法。首先构建了两个用于衡量SNP片段相似度和差异度的距离函数,然后基于这两个函数设计了一个再聚类算法用于求解MEC问题。该算法可以求解大规模问题,又克服了目前较有效的遗传算法的一些缺陷。在算法中还利用增加SNP片段数量的方法改善结果。但是有时得到的SNP片段的数量是有限的,因此又讨论了HRG问题。唯一的求解HRG模型的启发算法一前馈神经网络算法(FNN)还不够完善:容易陷于局部最优,受参数及初始权重的影响很大,而且得到的单体型与给定的基因型不一定完全相容。因此,针对HRG问题,基于距离函数构造了迭代的局部确定搜索方法。与FNN方法比较,该方法简单易行,不受各种参数的影响,而且通过大量的数值计算,计算结果表明我们的算法更有效。 (2)在第四章中,把基于连锁不均衡性(简称LD)的标签SNP选取问题转化为最小集合覆盖问题,并建立了数学优化模型,然后基于两种启发因子一集合中元素的数量和集合的覆盖度,建立启发函数。最后基于这个函数又构造了启发函数算法。与贪婪算法相比,我们的算法多考虑了一种启发因子-集合的覆盖度。通过验证,尽管我们的算法未必能找到最优解,但实验结果表明我们的算法在大多数情况下都能找到比贪婪算法更好的解。这充分证明了通过增加启发因子来改善启发函数,进而改善算法的合理性。 (3)在第五章中,研究了基因数据缺失值估算问题。把互信息理论运用于SNP位点相关性的研究中,利用联合互信息度量SNP位点之间的相关性。并构造了一种基于单体型估算方法的扩展方法。与基于单体型的估算方法比较,计算结果表明我们的算法更有效。这说明了互信息用于度量SNP位点之间相关性的有效性和可行性,同时也证实了并不一定是毗邻的SNP位点之间的相关性最强。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张勇;Y-DNA多态性分析与人类进化[J];国外医学.遗传学分册;1997年04期
2 ;发现之旅[J];国外社会科学文摘;2003年07期
3 曾长青;国际人类基因组单体型图计划[J];生物学通报;2004年02期
4 王起山;潘玉春;胡艳玲;;单体型关联分析方法研究进展[J];上海交通大学学报(农业科学版);2008年03期
5 胡劲松,党娜娜,黄辰,宋土生;国际人类基因组单体型图计划[J];国外医学.遗传学分册;2005年03期
6 吴雄文,张文杰,RL Dawkins,赵修竹;HLA-B与TNF基因间区的单体型特异性的多态现象[J];免疫学杂志;1993年02期
7 刘越;吕社民;;单核苷酸多态性影响基因功能的机制[J];生命的化学;2008年02期
8 王珏;罗玫;邹海;甘静;李星洁;陈强;郑忠伟;;最大似然法和方根法计算HLA三座位单体型频率的比较[J];中国输血杂志;2009年07期
9 李湘民;李静;曾凤;易红;;ITGA9基因rs189897与rs2212020及其单体型分子标志影响脑梗死发生[J];南方医科大学学报;2011年07期
10 何柳;唐迅;胡永华;;DNA混合分析技术的单体型频率估计方法[J];中南大学学报(医学版);2011年05期
11 唐双柏,郭景元,刘超,梁赏猷,王穗保;广州汉族人群DYS19、DYS389Ⅰ/Ⅱ、DYS390多态性及其单体型[J];遗传;2000年01期
12 王艳;朱晓辉;李平;刘传暄;刘萱;曹诚;;中国汉族人群MASP2基因单核苷酸多态性的连锁不平衡和单体型分析[J];生物技术通讯;2009年03期
13 黄艳梅;祁英杰;朱运良;童大跃;伍新尧;;7个Y-STR基因座荧光标记复合分型及在中国汉族群体中遗传多态性的研究[J];遗传;2007年10期
14 黄艳梅;祁英杰;杨保胜;童大跃;伍新尧;;中国云南白族和新疆维族7个Y-STR基因座的遗传多态性[J];人类学学报;2010年01期
15 李珍萍,王勇,赵玉英,章祥荪;单体型推断问题与配对图(英文)[J];高校应用数学学报A辑(中文版);2004年S1期
16 祁英杰;朱运良;王克杰;武红艳;黄艳梅;;河南汉族群体4个Y-STR基因座的遗传多态性[J];新乡医学院学报;2007年04期
17 谢民主;王建新;陈建二;;单体型组装问题MEC/GI模型的参数化算法[J];高技术通讯;2008年04期
18 朱运良;黄艳梅;李建金;伍新尧;;5个新Y-STR基因座及其在广州地区汉族群体内的单倍型分布(英文)[J];中山大学学报(医学科学版);2010年01期
19 李彩霞,黎培兴,方积乾;家系数据紧密连锁位点的单体型频率估计[J];中山大学学报(自然科学版);2005年03期
20 陈芳琦,吴锋,郭淮莲,余中清,R.L.Dawkins,赵修竹;中国湖北汉族随机正常人群HLA扩展单体型的检测[J];科学通报;1992年21期
中国重要会议论文全文数据库 前10条
1 林忠宁;;环境-致癌过程相关基因启动子区多态性及其单体型的功能分析[A];广东省环境诱变剂学会、广东省预防医学会卫生毒理专业委员会2010年学术会议资料汇编[C];2010年
2 徐新娟;梁晓慧;陈玉岚;珠勒皮亚;李素华;;VEGF基因单核苷酸多态性及其单体型与新疆维吾尔族长寿的关联研究[A];第十三次全国心血管病学术会议论文集[C];2011年
3 陈慧峰;林育纯;林丽娜;李文;罗洁;张树江;万建新;陈雯;林忠宁;;广东汉族人群PP2A-Aα亚基基因5'-侧翼区多态性的单体型分析[A];广东省环境诱变剂学会、广东省预防医学会卫生毒理专业委员会2010年学术会议资料汇编[C];2010年
4 田正芹;朱平;陈艳;刘红星;龚艺文;傅玉;王明英;夏君燕;白德成;;骨髓增殖性疾病46/1基因单体型和Jak2V617F的关系以及民族基因多态性差异[A];第13届全国实验血液学会议论文摘要[C];2011年
5 尹东;王海江;王琦三;孟涛;帕尔哈提;葛磊;王飞;;TNF-A基因多态及单体型与维、汉民族胃癌关系的研究[A];中华医学会肿瘤学分会第七届全国中青年肿瘤学术会议——中华医学会肿瘤学分会“中华肿瘤 明日之星”大型评选活动暨中青年委员全国遴选论文汇编[C];2011年
6 张继红;吴凌云;王勇;李珍萍;章祥荪;;由基因型SNP数据推断相应单体型的Markov链统计方法(英文)[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
7 王瑞省;吴凌云;李珍萍;章祥荪;;单体型装配问题及其遗传算法(英文)[A];中国运筹学会第七届学术交流会论文集(中卷)[C];2004年
8 付真彦;;CYP4F2基因单体型与心肌梗死的相关性研究[A];中华医学会心血管病学分会第十次全国心血管病学术会议汇编[C];2008年
9 徐新娟;梁晓慧;陈玉岚;珠勒皮亚;李素华;;TERT基因单核苷酸多态性及其单体型与新疆维吾尔族人长寿的关联研究[A];第十三次全国心血管病学术会议论文集[C];2011年
10 董琼珠;赵越;任宁;贾户亮;周海军;付丽云;孙健;史炯;戴春;薛裕华;黄华;武金才;叶青海;钦伦秀;;骨桥蛋白启动子多态性对肝癌预后的影响[A];第十二届全国肝癌学术会议论文汇编[C];2009年
中国博士学位论文全文数据库 前10条
1 汪颖;单体型和基因型问题的优化模型和算法[D];大连理工大学;2007年
2 谢民主;单体型组装问题参数化建模及算法研究[D];中南大学;2008年
3 姜波;中国汉族人群PAX6基因多态性与高度近视的关联研究[D];浙江大学;2011年
4 曾艺;凝血系统基因相关SNPs及其单体型与长沙地区汉族人群脑出血的关系研究[D];中南大学;2010年
5 李楠;PDE4D及IL-1基因多态性与中国汉族人群缺血性卒中的关联研究[D];中国医科大学;2010年
6 张强锋;单体分型和单体型频率估计[D];中国科学技术大学;2006年
7 武其文;基于家系和单体型的TIM-1及TIM-3基因多态性与变应性哮喘的关联研究[D];华中科技大学;2009年
8 王涛;中国人苯丙氨酸羟化酶基因突变的研究[D];中国协和医科大学;1994年
9 马红京;供者KIR和受者HLA遗传背景与亲缘全相合HSCT预后的关系[D];第一军医大学;2005年
10 孙蓓;藏族原发性高血压的分子遗传学研究[D];中国协和医科大学;2004年
中国硕士学位论文全文数据库 前10条
1 李自保;GSK-3β的rs334558和rs6438552位点基因多态性及其单体型与AD的相关性研究[D];中南大学;2010年
2 陈治中;湖北汉族人群TIM-3基因单体型与变应性哮喘相关性研究[D];华中科技大学;2008年
3 周伟;单体型组装加权最小字符翻转问题参数化算法研究[D];中南大学;2008年
4 梁彬彬;个体单体型检测问题的研究[D];广西师范大学;2013年
5 王颖;基于分块的单体型推导算法及缺失问题研究[D];中国科学技术大学;2011年
6 尤加永;脑源性神经营养因子单体型及载脂蛋白E基因多态性与晚发性抑郁症关系研究[D];南京医科大学;2009年
7 赵正中;AKT1基因多态性与重性抑郁症的关联性研究[D];重庆医科大学;2009年
8 宋波;白细胞介素-8基因多态性与胃癌恶病质的关系[D];青岛大学;2009年
9 顾淑君;PPAR γ基因Prol2Ala、C1431T和C681G多态性与脂质指标的相关性研究[D];苏州大学;2013年
10 戚玲;云南汉族FZD3基因rs2241802、rs2323019、rs352203多态性及其单体型与精神分裂症关联研究[D];昆明医学院;2008年
中国重要报纸全文数据库 前10条
1 本报记者 李雪墨 李斌;单体型图破解人类基因组奥秘[N];医药经济报;2003年
2 张荔子;血样有助于破解遗传之谜[N];大众卫生报;2003年
3 张荔子 张清润;注释“天书”[N];健康报;2006年
4 王雪飞;儿童多动症有了疗效预测模型[N];健康报;2006年
5 辛纹 李雪梅 李宓 毛磊 喻菲 欣华;成就与尴尬并存[N];医药经济报;2003年
6 李天舒;重启基因计划 拓展研究空间[N];健康报;2008年
7 李 斌;同一种药物药效为何因人而异[N];中国中医药报;2003年
8 姬十三;从沃森基因组到“炎黄一号”[N];南方周末;2007年
9 叶书宏;科学家分析DNA查明海龟迁徙路线[N];中国海洋报;2004年
10 衣晓峰;黑龙江省汉族人群HLA基因分型明确[N];中国医药报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978