收藏本站
《大连理工大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

单体型和基因型问题的优化模型和算法

汪颖  
【摘要】: 单核苷酸多态性(SNP)是人类基因组DNA序列变异的主要形式,是决定人类疾病易感性和药物反应性差异的核心信息。在SNP位置上的核苷酸称为等位基因(allele)。对于人类而言,位于一条染色体上某个区域上的一组等位基因称作单体型(haplotype),而位于一对染色体上某个区域的由成对的等位基因构成的序列称作基因型(genotype)。许多研究表明在预测、研究复杂疾病方面,单体型所携带的信息比单个的SNP或基因型数据的信息多得多。但是在现有实验条件下要获得单体型非常困难,而获得基因型数据或SNP数据却很容易,因此本文主要是利用SNP数据和基因型数据来研究单体型的重构问题以及带有基因信息的单体型重构问题。另外,实验数据中经常会遇到缺失现象和冗余现象,而这些现象在疾病关联研究中会阻碍进一步的分析和研究,因此又对这些问题进行了讨论。本论文主要是从数学优化的角度着手,针对单体型、基因型的相关问题建立优化模型并构造优化算法,目的是利用计算的手段更好地探究这些问题。本论文从以下三个方面进行论述: (1)在第三章中,分别对单体型重构问题中的最少错误纠正(MEC)问题和带有基因信息的单体型重构(HRG)问题建立了数学优化模型,并证明了模型的一些性质,如可行域的非空性、目标函数的有界性和最优解的存在性,最后又分别构造了两种启发式算法。首先构建了两个用于衡量SNP片段相似度和差异度的距离函数,然后基于这两个函数设计了一个再聚类算法用于求解MEC问题。该算法可以求解大规模问题,又克服了目前较有效的遗传算法的一些缺陷。在算法中还利用增加SNP片段数量的方法改善结果。但是有时得到的SNP片段的数量是有限的,因此又讨论了HRG问题。唯一的求解HRG模型的启发算法一前馈神经网络算法(FNN)还不够完善:容易陷于局部最优,受参数及初始权重的影响很大,而且得到的单体型与给定的基因型不一定完全相容。因此,针对HRG问题,基于距离函数构造了迭代的局部确定搜索方法。与FNN方法比较,该方法简单易行,不受各种参数的影响,而且通过大量的数值计算,计算结果表明我们的算法更有效。 (2)在第四章中,把基于连锁不均衡性(简称LD)的标签SNP选取问题转化为最小集合覆盖问题,并建立了数学优化模型,然后基于两种启发因子一集合中元素的数量和集合的覆盖度,建立启发函数。最后基于这个函数又构造了启发函数算法。与贪婪算法相比,我们的算法多考虑了一种启发因子-集合的覆盖度。通过验证,尽管我们的算法未必能找到最优解,但实验结果表明我们的算法在大多数情况下都能找到比贪婪算法更好的解。这充分证明了通过增加启发因子来改善启发函数,进而改善算法的合理性。 (3)在第五章中,研究了基因数据缺失值估算问题。把互信息理论运用于SNP位点相关性的研究中,利用联合互信息度量SNP位点之间的相关性。并构造了一种基于单体型估算方法的扩展方法。与基于单体型的估算方法比较,计算结果表明我们的算法更有效。这说明了互信息用于度量SNP位点之间相关性的有效性和可行性,同时也证实了并不一定是毗邻的SNP位点之间的相关性最强。
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:Q75

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 张培珍,付平,肖军,汤旭慧;基于快速聚类索引的图像检索系统[J];吉林大学学报(信息科学版);2004年06期
2 王瑞省,吴凌云,张继红,章祥荪;单体型装配问题及其算法(英文)[J];高校应用数学学报A辑(中文版);2004年S1期
3 毕华,李济洪;带有缺失数据的聚类分析方法[J];华北工学院学报;2003年05期
4 杨靖涛,王学林,胡于进;一种基于相似性的文档聚类算法[J];华中科技大学学报(自然科学版);2002年12期
5 黄东;唐俊;汪卫;施伯乐;;CuMen:基于最大频繁序列模式的聚类算法及其在基因拼接中的应用[J];计算机科学;2005年10期
6 张白妮,骆嘉伟,汤德佑;基于比对相似度动态矩阵聚类算法在基因序列中的应用[J];计算机应用;2004年08期
7 宋江春,沈钧毅,宋擒豹;一个基于关联规则的多层文档聚类算法[J];计算机应用;2005年07期
8 权光日,洪炳熔,叶风,任世军;集合覆盖问题的启发函数算法[J];软件学报;1998年02期
9 张白妮,骆嘉伟,汤德佑;动态的K-均值聚类算法在图像检索中的应用[J];计算机工程与设计;2004年10期
10 宫改云,毛用才,高新波,刘三阳;基于模糊c-均值聚类的微阵列基因表达数据分析[J];西安电子科技大学学报;2004年02期
【共引文献】
中国期刊全文数据库 前10条
1 裴国新,丛群滋;Web网站上果树专家系统开发与应用[J];山东农业科学;2002年03期
2 刘春春;;交通事故急救中心的选址问题研究[J];道路交通与安全;2010年03期
3 马娜;;文本聚类研究[J];电脑知识与技术;2009年20期
4 权光日,洪炳熔,李维刚;基于规则学习的前馈神经网络[J];哈尔滨工业大学学报;1998年04期
5 邱深山,权光日,孔令春,郭茂祖;连续属性空间上的规则学习算法[J];哈尔滨工业大学学报;2000年03期
6 王亚东,郭茂祖,张宝昌;一个新的基于扩张矩阵的规则抽取覆盖算法[J];哈尔滨工业大学学报;2000年04期
7 刘占生,武新华,夏松波;A Message Entropy Method of Learning from Examples[J];Journal of Harbin Institute of Technology;1997年03期
8 钱国良,王亚东,舒文豪;A 4-Corner Codes Classifier Based on Decision Tree Inductive Learning for Handwritten Chinese Characters[J];Journal of Harbin Institute of Technology;1998年02期
9 杨观赐;李琴;李少波;钟勇;;重用最大频繁模式的可持续进化算法[J];华南理工大学学报(自然科学版);2011年05期
10 杨观赐;李琴;李少波;钟勇;;基于序列挖掘的分等级搜索可持续进化算法[J];华中科技大学学报(自然科学版);2011年07期
中国重要会议论文全文数据库 前7条
1 崔光照;曹祥红;张华;;基于小波变换的基因表达数据去噪聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
2 王瑞省;吴凌云;李珍萍;章祥荪;;单体型装配问题及其遗传算法(英文)[A];中国运筹学会第七届学术交流会论文集(中卷)[C];2004年
3 ;Haplotyping an Single Individual From Weighted SNPs Fragments[A];中国运筹学会第七届学术交流会论文集(中卷)[C];2004年
4 杨德武;李霞;朱明珠;王靖;肖雪;;离子通道基因表达谱及其亚型一致性的研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
5 潘娅英;;近50年浙西南汛期旱涝变化及特征[A];中国气象学会2005年年会论文集[C];2005年
6 武森;张桂琼;王莹;吴玲玉;;容差集合差异度高维不完备数据聚类[A];第十二届中国管理科学学术年会论文集[C];2010年
7 潘娅英;;近50年丽水汛期旱涝变化及特征分析[A];第二届浙江中西部科技论坛论文集第二卷(气象分卷)[C];2005年
中国博士学位论文全文数据库 前8条
1 张彦春;铁路防洪应急物资优化布局及调配研究[D];中南大学;2011年
2 赵秀丽;航空公司不正常航班恢复模型及算法研究[D];南京航空航天大学;2010年
3 张强锋;单体分型和单体型频率估计[D];中国科学技术大学;2006年
4 谢铉洋;SARS医学图像识别与辅助诊断研究[D];中国科学技术大学;2006年
5 谢民主;单体型组装问题参数化建模及算法研究[D];中南大学;2008年
6 吴璟莉;遗传多态性检测中组合优化问题的研究[D];中南大学;2008年
7 赵裕众;生物序列分析算法的研究及其应用[D];中国科学技术大学;2010年
8 秦传东;模糊与双重正则化支持向量机的研究及应用[D];西安电子科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 邬惠远;基于图像识别的商标检索系统设计与实现[D];电子科技大学;2010年
2 陈姝伊;个体单体型组装问题MEC模型的算法研究与比较[D];西安电子科技大学;2010年
3 石飞燕;数据密集型计算中副本优化机制研究[D];武汉理工大学;2011年
4 赵文霞;基于相关反馈的图像检索技术研究[D];中北大学;2011年
5 李伟;高速公路养护站点分级建立与选址研究[D];长安大学;2011年
6 张宏;机组排班中多任务调度技术研究[D];南京航空航天大学;2010年
7 汤岑书;基于制造资源的加工特征识别方法研究[D];上海交通大学;2011年
8 王亚;应急医疗服务医院能力评价及选择研究[D];东北大学;2009年
9 王丹;基于版面结构的文本图像检索技术研究[D];山东师范大学;2012年
10 应卓瑜;ALV二维道路分割算法研究与实现[D];浙江大学;2005年
【二级参考文献】
中国期刊全文数据库 前2条
1 谢毓湘,吴玲达,张宪海,老松杨;聚类算法在基于内容图象检索中的应用研究[J];计算机应用研究;2000年09期
2 邹涛,黄源,张福炎;基于WWW的文本信息挖掘[J];情报学报;1999年04期
【相似文献】
中国期刊全文数据库 前10条
1 李小虎;杜海峰;庄健;王孙安;;基于小世界原理的模型降阶优化研究[J];西安交通大学学报;2009年01期
2 董继学;张虹;葛慧玲;侯丽英;朱桂英;丁艳清;;基于微粒群算法的辽宁省可持续农业产业结构优化配置研究[J];生物数学学报;2010年04期
3 王正初;李微微;;基于粒子群算法的可靠性优化[J];台州学院学报;2006年06期
4 张旭,冯恩民;具有性能约束布局问题的优化算法及收敛性[J];大连理工大学学报;2005年05期
5 王秋颖;火电厂循环水系统经济运行方式的探讨[J];节能;1999年08期
6 邹晓菊,岑晓江,卢大儒;CYP1 A1多态性在上海人群中的分布[J];昆明师范高等专科学校学报;2004年04期
7 王英;张莹;史俊南;;牙本质磷蛋白基因突变和序列多态性分析[J];牙体牙髓牙周病学杂志;2006年06期
8 戴穹;;中国汉族人群补体C6 A413C单核苷酸多态性的研究[J];泸州医学院学报;2006年05期
9 张程;焦肖霞;成永强;李正平;;支化滚环扩增均相光散射检测单核苷酸多态性[J];分析化学;2011年07期
10 柯玉雄,卫灿东,金建中,金力;用SnaP Shot的方法对线粒体7146位点进行基因分型[J];复旦学报(自然科学版);2002年06期
中国重要会议论文全文数据库 前10条
1 武淑兰;李渊;;DNMT3B基因启动子-149位单核苷酸多态性与急性白血病的关系[A];第九届全国实验血液学会议论文摘要汇编[C];2003年
2 郑涓;;SIRT1单核苷酸多态性与中国武汉地区汉族人群超重的相关性研究[A];中华医学会第十次全国内分泌学学术会议论文汇编[C];2011年
3 高英堂;刘娟娟;杜智;王伟丽;刘彤;王毅军;杨斌;;IL-10、ALDH2单核苷酸多态性与肝病的相关性研究[A];天津市生物医学工程学会第29届学术年会暨首届生物医学工程前沿科学研讨会论文集[C];2009年
4 周庆辉;王金花;黄秀峰;林朝文;杨园园;吴联滔;吴玉梅;;MMP14基因单核苷酸多态性在广西百色地区壮族人群中的分布[A];中国解剖学会2011年年会论文文摘汇编[C];2011年
5 吕纪永;;电气特性优化模型在制定电弧炉供电制度中的应用[A];2005中国钢铁年会论文集(第4卷)[C];2005年
6 刘娟娟;高英堂;杜智;杨斌;经翔;王毅军;王凤梅;刘彤;;IL-10基因启动子区单核苷酸多态性与HBV感染后疾病转归的研究[A];天津市生物医学工程学会第30次学术年会暨生物医学工程前沿科学研讨会论文集[C];2010年
7 郝萍;金艳花;杨康鹃;;KCNJ11基因单核苷酸多态性与胰岛素分泌异常(英文)[A];中国的遗传学研究——遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编[C];2011年
8 王金花;黄秀峰;周庆辉;林朝文;杨园园;韦叶生;黄昌盛;吴联滔;吴玉梅;何兰凤;;广西百色地区壮族妇女脂联素基因单核苷酸多态性与骨密度的关系研究[A];中国解剖学会2011年年会论文文摘汇编[C];2011年
9 克丙申;张胜兰;邢万佳;黄象艳;周仲玲;徐军;齐发莲;;中国人(山东地区)HLA-DPB1基因单核苷酸多态性的初步研究[A];山东免疫学会、山东微生物学会医学微生物学专业委员会、山东省医学会微生物学和免疫学专业委员会、山东省医药生物技术学会2001年学术年会论文汇编[C];2001年
10 王海振;郝萍;李迪;王伟杰;咸哲民;朴禹;金雄吉;崔正伟;杨康鹃;;KCNJ11基因单核苷酸多态性与2型糖尿病关系的研究[A];中国的遗传学研究——遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编[C];2011年
中国重要报纸全文数据库 前10条
1 记者 张荔子;我国启动人类单核苷酸多态性研究[N];健康报;2000年
2 记者 游雪靖;我国启动人类单核苷酸多态性研究计划[N];科技日报;2000年
3 吴志军;单核苷酸多态性影响乙肝慢性化[N];健康报;2004年
4 麦国荣;单核苷酸多态性与个体化用药[N];中国医药报;2003年
5 王敏 齐云;利用多种策略优化模型[N];中国医药报;2007年
6 ;增添硬模块优化算法MCU触控更显优势[N];中国电子报;2010年
7 ;儿童系统性红斑狼疮中白细胞介素-10启动子区单核苷酸多态性对自身表达水平的影响[N];中国医药报;2003年
8 漆永新;相互融合 创新提升[N];中国冶金报;2008年
9 庄少文;控制风险 增强收益[N];证券日报;2005年
10 记者 陈耀群;船舶智能推进系统研究项目通过鉴定[N];中国船舶报;2006年
中国博士学位论文全文数据库 前10条
1 汪颖;单体型和基因型问题的优化模型和算法[D];大连理工大学;2007年
2 郑龙;随机运输网络优化模型及其算法研究[D];国防科学技术大学;2009年
3 梁剑;基于成本优化的民用航空发动机视情维修决策研究[D];南京航空航天大学;2005年
4 李世军;油田生产系统整体优化理论与方法[D];大庆石油学院;2005年
5 余自强;抗血小板胶原受体糖蛋白VI单克隆抗体的制备和功能研究[D];苏州大学;2005年
6 关勇;提高电能效率目的下电网企业购售电风险度量与控制模型[D];华北电力大学(北京);2009年
7 史丽;人类CYP2A13基因SNPs及其与喉、咽、鼻恶性肿瘤危险性的相关性研究[D];山东大学;2005年
8 赵培忻;物流系统中若干优化模型及其算法研究[D];山东大学;2005年
9 刘丽波;精神分裂症相关基因的遗传学研究[D];吉林大学;2006年
10 程学庆;列流图自动生成与空车调配相关问题研究[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 杨凯尧;精馏生产过程稳态建模及其优化[D];吉林大学;2006年
2 秦璇;基于CDaR模型有效前沿的研究[D];华中科技大学;2006年
3 户晓玲;基于微粒群模型的无线传感器网络节点部署研究[D];太原科技大学;2009年
4 卢艳超;内蒙古自治区发电能源结构优化模型研究[D];华北电力大学(河北);2007年
5 陈桢;遗传算法在森林收获调整中的应用以及软件的研究[D];福建农林大学;2007年
6 吕纳强;HLA-DQ基因与大动脉炎[D];中国协和医科大学;2007年
7 吴水晶;β防御素1基因启动子区域-688G/C单核苷酸多态性与重症脓毒症发生发展的相关性研究[D];浙江大学;2008年
8 王丹妮;COMT基因遗传多态性与汉族人白癜风易感性关联分析[D];安徽医科大学;2009年
9 卢亦平;视频点播系统中的优化模型研究与计算[D];大连理工大学;2005年
10 张来军;Oligophrenin-1基因单核苷酸多态性与秦巴山区智力及精神发育迟滞的关联分析[D];西北大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026