收藏本站
收藏 | 论文排版

单体型和基因型问题的优化模型和算法

汪颖  
【摘要】: 单核苷酸多态性(SNP)是人类基因组DNA序列变异的主要形式,是决定人类疾病易感性和药物反应性差异的核心信息。在SNP位置上的核苷酸称为等位基因(allele)。对于人类而言,位于一条染色体上某个区域上的一组等位基因称作单体型(haplotype),而位于一对染色体上某个区域的由成对的等位基因构成的序列称作基因型(genotype)。许多研究表明在预测、研究复杂疾病方面,单体型所携带的信息比单个的SNP或基因型数据的信息多得多。但是在现有实验条件下要获得单体型非常困难,而获得基因型数据或SNP数据却很容易,因此本文主要是利用SNP数据和基因型数据来研究单体型的重构问题以及带有基因信息的单体型重构问题。另外,实验数据中经常会遇到缺失现象和冗余现象,而这些现象在疾病关联研究中会阻碍进一步的分析和研究,因此又对这些问题进行了讨论。本论文主要是从数学优化的角度着手,针对单体型、基因型的相关问题建立优化模型并构造优化算法,目的是利用计算的手段更好地探究这些问题。本论文从以下三个方面进行论述: (1)在第三章中,分别对单体型重构问题中的最少错误纠正(MEC)问题和带有基因信息的单体型重构(HRG)问题建立了数学优化模型,并证明了模型的一些性质,如可行域的非空性、目标函数的有界性和最优解的存在性,最后又分别构造了两种启发式算法。首先构建了两个用于衡量SNP片段相似度和差异度的距离函数,然后基于这两个函数设计了一个再聚类算法用于求解MEC问题。该算法可以求解大规模问题,又克服了目前较有效的遗传算法的一些缺陷。在算法中还利用增加SNP片段数量的方法改善结果。但是有时得到的SNP片段的数量是有限的,因此又讨论了HRG问题。唯一的求解HRG模型的启发算法一前馈神经网络算法(FNN)还不够完善:容易陷于局部最优,受参数及初始权重的影响很大,而且得到的单体型与给定的基因型不一定完全相容。因此,针对HRG问题,基于距离函数构造了迭代的局部确定搜索方法。与FNN方法比较,该方法简单易行,不受各种参数的影响,而且通过大量的数值计算,计算结果表明我们的算法更有效。 (2)在第四章中,把基于连锁不均衡性(简称LD)的标签SNP选取问题转化为最小集合覆盖问题,并建立了数学优化模型,然后基于两种启发因子一集合中元素的数量和集合的覆盖度,建立启发函数。最后基于这个函数又构造了启发函数算法。与贪婪算法相比,我们的算法多考虑了一种启发因子-集合的覆盖度。通过验证,尽管我们的算法未必能找到最优解,但实验结果表明我们的算法在大多数情况下都能找到比贪婪算法更好的解。这充分证明了通过增加启发因子来改善启发函数,进而改善算法的合理性。 (3)在第五章中,研究了基因数据缺失值估算问题。把互信息理论运用于SNP位点相关性的研究中,利用联合互信息度量SNP位点之间的相关性。并构造了一种基于单体型估算方法的扩展方法。与基于单体型的估算方法比较,计算结果表明我们的算法更有效。这说明了互信息用于度量SNP位点之间相关性的有效性和可行性,同时也证实了并不一定是毗邻的SNP位点之间的相关性最强。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李小虎;杜海峰;庄健;王孙安;;基于小世界原理的模型降阶优化研究[J];西安交通大学学报;2009年01期
2 董继学;张虹;葛慧玲;侯丽英;朱桂英;丁艳清;;基于微粒群算法的辽宁省可持续农业产业结构优化配置研究[J];生物数学学报;2010年04期
3 王正初;李微微;;基于粒子群算法的可靠性优化[J];台州学院学报;2006年06期
4 张旭,冯恩民;具有性能约束布局问题的优化算法及收敛性[J];大连理工大学学报;2005年05期
5 王秋颖;火电厂循环水系统经济运行方式的探讨[J];节能;1999年08期
6 邹晓菊,岑晓江,卢大儒;CYP1 A1多态性在上海人群中的分布[J];昆明师范高等专科学校学报;2004年04期
7 王英;张莹;史俊南;;牙本质磷蛋白基因突变和序列多态性分析[J];牙体牙髓牙周病学杂志;2006年06期
8 戴穹;;中国汉族人群补体C6 A413C单核苷酸多态性的研究[J];泸州医学院学报;2006年05期
9 张程;焦肖霞;成永强;李正平;;支化滚环扩增均相光散射检测单核苷酸多态性[J];分析化学;2011年07期
10 柯玉雄,卫灿东,金建中,金力;用SnaP Shot的方法对线粒体7146位点进行基因分型[J];复旦学报(自然科学版);2002年06期
11 范宗理;;单核苷酸多态性的作用[J];自然杂志;2007年04期
12 赵玉琼;姚春涛;刘亚千;黄丽洁;赵亚力;赵权;陈华;;我国特有三个小型猪品系PPARα基因的多态性分析[J];中国比较医学杂志;2008年10期
13 张来军;郑子健;张科进;高晓彩;陈超;黄绍平;张富昌;;OPHN1基因rs492933位点多态性与秦巴山区汉族儿童非特异精神发育迟滞的相关性研究[J];遗传;2008年10期
14 陈鹏;樊春海;贺林;师咏勇;;基因分型技术的研究进展[J];细胞生物学杂志;2009年02期
15 胡海芳;王燕;张华;谭国萍;向阳冰;;维吾尔族CD14基因单核苷酸多态性和遗传结构分析[J];中国现代医学杂志;2011年16期
16 郭刚;DNA芯片技术与SNP分析[J];国外医学.卫生学分册;2004年01期
17 周斌,张思仲,肖翠英,张克兰,张立,李贵星,李萍,刘合焜,郑克勤;胆固醇7α-羟化酶基因A-204C单核苷酸多态性及其与血浆血脂的关联[J];遗传;2004年03期
18 林忠宁,凌文华,Baitang Ning,Fred K Kadlubar;ERCC6基因启动子区-6530C→G单核苷酸多态性的功能性分析[J];毒理学杂志;2005年S1期
19 张小燕,左明雪,张占军,王忠,李瑶;用基因芯片检测单核苷酸多态性反应原理[J];中国生物工程杂志;2005年11期
20 许盛海;包文斌;黄军;程金花;束婧婷;陈国宏;;鸭生长激素基因内含子2、3多态性分析[J];遗传;2007年04期
中国重要会议论文全文数据库 前10条
1 武淑兰;李渊;;DNMT3B基因启动子-149位单核苷酸多态性与急性白血病的关系[A];第九届全国实验血液学会议论文摘要汇编[C];2003年
2 郑涓;;SIRT1单核苷酸多态性与中国武汉地区汉族人群超重的相关性研究[A];中华医学会第十次全国内分泌学学术会议论文汇编[C];2011年
3 高英堂;刘娟娟;杜智;王伟丽;刘彤;王毅军;杨斌;;IL-10、ALDH2单核苷酸多态性与肝病的相关性研究[A];天津市生物医学工程学会第29届学术年会暨首届生物医学工程前沿科学研讨会论文集[C];2009年
4 周庆辉;王金花;黄秀峰;林朝文;杨园园;吴联滔;吴玉梅;;MMP14基因单核苷酸多态性在广西百色地区壮族人群中的分布[A];中国解剖学会2011年年会论文文摘汇编[C];2011年
5 吕纪永;;电气特性优化模型在制定电弧炉供电制度中的应用[A];2005中国钢铁年会论文集(第4卷)[C];2005年
6 刘娟娟;高英堂;杜智;杨斌;经翔;王毅军;王凤梅;刘彤;;IL-10基因启动子区单核苷酸多态性与HBV感染后疾病转归的研究[A];天津市生物医学工程学会第30次学术年会暨生物医学工程前沿科学研讨会论文集[C];2010年
7 郝萍;金艳花;杨康鹃;;KCNJ11基因单核苷酸多态性与胰岛素分泌异常(英文)[A];中国的遗传学研究——遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编[C];2011年
8 王金花;黄秀峰;周庆辉;林朝文;杨园园;韦叶生;黄昌盛;吴联滔;吴玉梅;何兰凤;;广西百色地区壮族妇女脂联素基因单核苷酸多态性与骨密度的关系研究[A];中国解剖学会2011年年会论文文摘汇编[C];2011年
9 克丙申;张胜兰;邢万佳;黄象艳;周仲玲;徐军;齐发莲;;中国人(山东地区)HLA-DPB1基因单核苷酸多态性的初步研究[A];山东免疫学会、山东微生物学会医学微生物学专业委员会、山东省医学会微生物学和免疫学专业委员会、山东省医药生物技术学会2001年学术年会论文汇编[C];2001年
10 王海振;郝萍;李迪;王伟杰;咸哲民;朴禹;金雄吉;崔正伟;杨康鹃;;KCNJ11基因单核苷酸多态性与2型糖尿病关系的研究[A];中国的遗传学研究——遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编[C];2011年
中国博士学位论文全文数据库 前10条
1 汪颖;单体型和基因型问题的优化模型和算法[D];大连理工大学;2007年
2 郑龙;随机运输网络优化模型及其算法研究[D];国防科学技术大学;2009年
3 梁剑;基于成本优化的民用航空发动机视情维修决策研究[D];南京航空航天大学;2005年
4 李世军;油田生产系统整体优化理论与方法[D];大庆石油学院;2005年
5 余自强;抗血小板胶原受体糖蛋白VI单克隆抗体的制备和功能研究[D];苏州大学;2005年
6 关勇;提高电能效率目的下电网企业购售电风险度量与控制模型[D];华北电力大学(北京);2009年
7 史丽;人类CYP2A13基因SNPs及其与喉、咽、鼻恶性肿瘤危险性的相关性研究[D];山东大学;2005年
8 赵培忻;物流系统中若干优化模型及其算法研究[D];山东大学;2005年
9 刘丽波;精神分裂症相关基因的遗传学研究[D];吉林大学;2006年
10 程学庆;列流图自动生成与空车调配相关问题研究[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 杨凯尧;精馏生产过程稳态建模及其优化[D];吉林大学;2006年
2 秦璇;基于CDaR模型有效前沿的研究[D];华中科技大学;2006年
3 户晓玲;基于微粒群模型的无线传感器网络节点部署研究[D];太原科技大学;2009年
4 卢艳超;内蒙古自治区发电能源结构优化模型研究[D];华北电力大学(河北);2007年
5 陈桢;遗传算法在森林收获调整中的应用以及软件的研究[D];福建农林大学;2007年
6 吕纳强;HLA-DQ基因与大动脉炎[D];中国协和医科大学;2007年
7 吴水晶;β防御素1基因启动子区域-688G/C单核苷酸多态性与重症脓毒症发生发展的相关性研究[D];浙江大学;2008年
8 王丹妮;COMT基因遗传多态性与汉族人白癜风易感性关联分析[D];安徽医科大学;2009年
9 卢亦平;视频点播系统中的优化模型研究与计算[D];大连理工大学;2005年
10 张来军;Oligophrenin-1基因单核苷酸多态性与秦巴山区智力及精神发育迟滞的关联分析[D];西北大学;2005年
中国重要报纸全文数据库 前10条
1 记者 张荔子;我国启动人类单核苷酸多态性研究[N];健康报;2000年
2 记者 游雪靖;我国启动人类单核苷酸多态性研究计划[N];科技日报;2000年
3 吴志军;单核苷酸多态性影响乙肝慢性化[N];健康报;2004年
4 麦国荣;单核苷酸多态性与个体化用药[N];中国医药报;2003年
5 王敏 齐云;利用多种策略优化模型[N];中国医药报;2007年
6 ;增添硬模块优化算法MCU触控更显优势[N];中国电子报;2010年
7 ;儿童系统性红斑狼疮中白细胞介素-10启动子区单核苷酸多态性对自身表达水平的影响[N];中国医药报;2003年
8 漆永新;相互融合 创新提升[N];中国冶金报;2008年
9 庄少文;控制风险 增强收益[N];证券日报;2005年
10 记者 陈耀群;船舶智能推进系统研究项目通过鉴定[N];中国船舶报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978