收藏本站
《湖南大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于随机森林的致病SNPs检测方法研究

姚俊杰  
【摘要】:随着高通量测序技术的发展,并伴随着国际人类基因组单体型作图计划的完成,全基因组关联研究在技术上和费用上逐渐变得可以实行,因此对复杂疾病的致病基因检测是一个重要的研究课题。同时,复杂疾病一般都是由多个基因-基因相互作用的结果,因此基因间相互作用也将成为一个重要的研究方向。 随机森林是一种新型的数据挖掘方法,逐渐开始应用于各个领域。随机森林方法不仅能够预测分类结果,而且能够计算变量重要性值,本文应用随机森林方法分析全基因组SNP数据集,计算每个SNP变量重要性值,变量重要性值越高的SNP致病性越强,以此为依据探测和疾病密切相关的SNPs。对风湿性关节炎模拟数据集和老年性黄斑变性真实数据集生长出随机森林并计算每个SNP的变量重要性值,得到变量重要性值最高的SNPs,实验结果表明该方法可以作为致病SNPs检测的有效参考方法。 随后,针对SNP-SNP相互作用组合数目过大问题,以及随机森林生成过程中分类树的数目、节点随机属性数目参数选择的可靠性问题,提出了一种基于随机森林的SNPs子集过滤方法,获得了数目较少的SNPs子集,并进一步的分析了单点或者SNP间相互作用关系。对老年性黄斑变性真实数据集实验结果表明,该方法可以有效的探测致病SNPs以及SNP-SNP间相互作用,对进一步的生化实验具有有效的参考价值。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:Q811.4

手机知网App
【共引文献】
中国重要会议论文全文数据库 前1条
1 Xinhao WANG, Dingsheng LUO, Xihong WU, Huisheng CHI National Laboratory on Machine Perception, School of Electronics Engineering & Computer Science, Peking University, No.5 Summer Palace Road, Handian District, Beijing, 100871;Improving Chinese Text Categorization by Outlier Learning[A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering[C];2005年
中国博士学位论文全文数据库 前10条
1 张国江;软计算方法和数据挖掘理论在电力系统负荷预测中的应用[D];浙江大学;2002年
2 邹涛;智能网络入侵检测系统关键技术研究[D];国防科学技术大学;2004年
3 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
4 田新广;基于主机的入侵检测方法研究[D];国防科学技术大学;2005年
5 徐凌宇;基于信源选择与序列提取的动态特征级信息融合模型及算法的研究[D];东北大学;2002年
6 何灵敏;支持向量机集成及在遥感分类中的应用[D];浙江大学;2006年
7 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年
8 王先基;基于统计学习的自动人脸识别算法研究[D];中国科学技术大学;2007年
9 孙卫祥;基于数据挖掘与信息融合的故障诊断方法研究[D];上海交通大学;2006年
10 周燕平;多元校正与定量结构活性相关性研究中新型化学计量学算法研究[D];湖南大学;2007年
中国硕士学位论文全文数据库 前9条
1 吴小明;考虑气象条件下的电力系统短期负荷预测研究[D];浙江大学;2003年
2 赵桂敏;基于综合集成的人脸识别[D];中南大学;2004年
3 刘文瑶;多分类器系统中的组合方法及差异性度量研究[D];浙江大学;2005年
4 许少华;数据挖掘技术在包装企业管理中的应用探讨[D];西安理工大学;2005年
5 宾宁;分布式环境下数据挖掘分类算法研究[D];中南大学;2005年
6 夏应龙;分布式异构数据的统计机器学习方法研究[D];清华大学;2006年
7 孙庆欣;基于支持向量机的集成学习音频分类算法[D];吉林大学;2007年
8 蒋红;中文文本分类中文本表示及分类算法研究[D];浙江师范大学;2007年
9 王鹏;基于差异性度量的多分类器融合研究[D];江苏大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 邹喻苹,葛颂;新一代分子标记——SNPs及其应用[J];生物多样性;2003年05期
2 陈艺,吴登俊;单核苷酸多态性(SNPs)——第三代DNA分子标记[J];畜牧与兽医;2003年12期
3 CMBE译文组;单核苷酸多态性[J];现代临床医学生物工程学杂志;2003年06期
4 陈香梅;人类单核苷酸多态性的研究及应用[J];医学综述;2004年10期
5 刘健毅,潘建伟,朱睦元,顾青;单核苷酸多态性(SNPs)原理及其在植物功能基因组学中的应用前景[J];细胞生物学杂志;2002年05期
6 许传超,蔡贵庆,伍新尧,邓慧敏,赵方,童大跃,李建金;检测线粒体DNA SNPs的快速测定法——引物延伸—飞行时间质谱法[J];中山大学学报(自然科学版);2003年05期
7 江玉梅,杨桂玲;连锁不平衡的研究与应用[J];江西植保;2004年02期
8 马永平,易发平;焦磷酸测序技术及其在分子生物学领域的应用[J];国外医学.分子生物学分册;2003年02期
9 包广宇;单核苷酸多态性的研究进展及其应用[J];国外医学.遗传学分册;2003年01期
10 FrancisCollins,顾鸣敏,管泽强;人类基因组研究的新热点──编制人类DNA序列变异 的目录[J];世界科学;1998年04期
中国重要会议论文全文数据库 前10条
1 王凤丽;曾翠平;楚原梦冉;刘榜;;猪FKTN基因的SNPs扫描及其与经济性状的关联分析[A];第十二次全国畜禽遗传标记研讨会论文集[C];2010年
2 邹喻苹;葛颂;;新一代分子标记——SNPs及其应用[A];中国植物学会七十周年年会论文摘要汇编(1933—2003)[C];2003年
3 丁显平;;Detection SNPs by Multi-Analyze Suspension Array(Abstract)[A];中国的遗传学研究——遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编[C];2011年
4 ;Development and application of rice whole genome single nucleotide polymorphisms (SNPs) detection platforms[A];第十一届全国植物基因组学大会摘要集[C];2010年
5 宋昕;杨建学;李兴川;李江曼;范宗民;王苒;赵学科;韩雪娜;齐红;周福有;李学民;纪爱芳;王立东;;61781例食管癌患者家族史与2个SNPs变异相关性分析[A];全国肿瘤流行病学和肿瘤病因学学术会议论文集[C];2011年
6 Y. L. Jiang;N. Li;G.Plastow;Z. L. Liu;X. X. Hu;C. X. Wu;;IDENTIFICATION OF THREE SNPs IN THE PORCINE MYOSTATIN GENE(MSTN)[A];第六届动物遗传学讨论会论文集[C];2002年
7 陈慧;黄巍;杨渝珍;;基于PCR衍生技术和寡核苷酸芯片的SNPs检测方法的改良[A];湖北省暨武汉生物化学与分子生物学学会第八届会员代表大会和第十五次学术年会论文摘要汇编[C];2004年
8 林仲旸;章跃陵;李远友;;拟穴青蟹SpToll基因的克隆、表达及其SNPs研究[A];渔业科技创新与发展方式转变——2011年中国水产学会学术年会论文摘要集[C];2011年
9 朴海仙;曹阳;张立春;金一;于永生;刘晓辉;赵卓;金海国;刘臣;;松辽白鹅GH基因SNPs检测及与屠宰性能的关系[A];第十二次全国畜禽遗传标记研讨会论文集[C];2010年
10 额尔和花;詹慧琴;张淑君;彭秀丽;龚炎长;;鸡催乳素基因外显子中的SNP检测[A];家禽研究最新进展——第十一次全国家禽学术讨论会论文集[C];2003年
中国重要报纸全文数据库 前10条
1 林碧莲;SNP分析首当其冲[N];医药经济报;2001年
2 本报记者 李雪墨 李斌;单体型图破解人类基因组奥秘[N];医药经济报;2003年
3 张可喜;基因领域狼烟又起[N];医药经济报;2001年
4 齐继成;个性化药物研发新动向[N];中国医药报;2002年
5 张海波;东芝有“芯”查丙肝[N];医药经济报;2001年
6 余志平;“量体裁衣”新工具[N];医药经济报;2002年
7 朱国旺;机遇凸显 我们如何把握[N];中国医药报;2003年
8 靖九江;ACC2005年年会热点聚焦[N];中国医药报;2005年
9 本报记者 游雪晴;解读“生命天书”更重要[N];科技日报;2000年
10 ;药物基因组学诊断技术开发进展[N];中国医药报;2004年
中国博士学位论文全文数据库 前10条
1 黄生强;SNP标记定位猪4号染色体QTLs及DECR1基因SNPs与猪经济性状关联研究[D];湖南农业大学;2010年
2 刘榜;15个猪品种MHCⅡ类区4个基因的SNPs分析及与免疫性状的关联[D];华中农业大学;2003年
3 娄春光;44个SNPs位点复合分型体系的构建及其法医学应用[D];河北医科大学;2010年
4 刘希华;欧洲黑杨幼苗氮高效基因型及SNPs标记筛选研究[D];南京林业大学;2010年
5 程浩;大豆异黄酮合酶,黄烷酮3-羟化酶基因SNPs与种子异黄酮含量及抗逆性的关联分析[D];南京农业大学;2008年
6 王红星;弹性蛋白及其代谢通路相关基因SNPs及单体型与长沙汉族人群脑出血的关系研究[D];中南大学;2012年
7 曾艺;凝血系统基因相关SNPs及其单体型与长沙地区汉族人群脑出血的关系研究[D];中南大学;2010年
8 欧阳建华;鸡生长轴基因的SNPs分析及cGHR基因第八、九内含子的克隆测序研究[D];湖南农业大学;2004年
9 王彦芳;猪PA28和PA700基因家族相关基因的分离、定位、SNPs检测及其与性状的关联分析[D];华中农业大学;2004年
10 侯启瑞;IGFs、LYZ基因和EAV-HP DNA序列SNPs与京海黄鸡经济性状的关联分析[D];扬州大学;2010年
中国硕士学位论文全文数据库 前10条
1 姚俊杰;基于随机森林的致病SNPs检测方法研究[D];湖南大学;2012年
2 梁爽;叶酸代谢通路相关基因SNPs与孕妇同型半胱氨酸代谢能力的相关性分析[D];复旦大学;2012年
3 杨甲芳;七个猪种Pit-1基因部分cDNA序列的SNPs分析[D];东北农业大学;2003年
4 高小劲;中国汉族原发性闭角型青光眼患者候选基因的SNPs位点与疾病的相关性分析[D];重庆医科大学;2012年
5 李姣;中国西门塔尔牛5个基因SNPs及表达量与经济性状关联分析[D];中国农业科学院;2010年
6 黄永震;黄牛NPM1、SREBP1c基因的克隆、SNPs检测及其与生长性状的关系[D];西北农林科技大学;2010年
7 卫小静;利用SNPs进行唐氏综合征无创性产前诊断的可行性研究[D];山西医科大学;2011年
8 孔繁丽;BCDO2基因中3个SNPs在中国家鸡中的遗传多样性及与肤色的相关性分析[D];四川农业大学;2012年
9 常振华;中国黄牛Y染色体微卫星和SNPs遗传多样性与起源研究[D];西北农林科技大学;2011年
10 侯飞;黄牛ANGPTL4、GPIHBP1基因SNPs检测及其与生长性状的关联分析[D];西北农林科技大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026