收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于SNP的特征选择及精神分裂症诊断模型研究

邢斌  
【摘要】:精神分裂症作为一组重度精神类病症,会对个人社交行为、现实感知及社会经济发展造成恶劣影响,这种复杂疾病致病因素的不确定性对其研究有着重大阻碍,而单核苷酸多态性(Single Nucleotide Polymorphism,SNP)指的是不同人之间碱基差异导致的DNA多样性,SNP在精神分裂症易感位点识别和构建疾病诊断模型上有着重大作用。伴随着机器学习和深度学习的进一步成熟,越来越多的研究人员试图从SNP数据中挖掘遗传信息并构建疾病诊断模型。本论文以精神分裂症相关SNP数据为对象进行研究,首先使用新提出的KMIGS/BH-PSO特征选择算法对原始SNP数据集进行信息SNP子集的生成;然后以信息SNP子集为输入数据设计了基于三元分区深度信念网络的模型,以实现对精神分裂症患者的临床诊断。具体研究如下:(1)为解决传统聚类算法无法有效挖掘SNP之间多位点存在的强关联性的问题,提出了新的聚类算法——K-MIGS。一方面该算法在原有K-Means聚类的基础上,引入了互信息和信息熵,提出新的相似度度量方法MIGS用以衡量多个SNP位点之间的相似度;另一方面使用新提出的SNP邻近数来初始化簇中心以解决传统K-Means随机初始化方式带来的效率低下问题。K-MIGS算法解决了传统聚类中欧氏度量方法不能挖掘到多SNP位点之间的关联性及效率过低的问题,并且极大程度上降低了SNP数据集的维数。最后将粒子群算法应用到信息SNP的选择中,按照一定原则从每个簇中选出合适的SNP,生成最终的信息SNP子集。在聚类和信息SNP生成实验中显示,K-MIGS较其他方法具有更好的聚类效果和更高的SNP重构准确度,并且在最后使用支持向量机、随机森林和神经网络对构造的SNP子集进行的分类实验中显示,对比同种特征选择方法KMeans/PSO、K-Center/PSO和不同种特征选择方法ReliefF、MCMR,K-MIGS在分类准确率上提升了3.25%~6.35%,充分说明K-MIGS聚类算法在挖掘SNP深层信息上具有更好的效果。(2)为解决传统粒子群算法在生成信息SNP子集时筛选出的SNP个数较多且收敛过慢的问题,提出改进的粒子群算法BH-PSO算法,该算法使用新的混合初始化对粒子群进行初始化,可以在选择出更少信息SNP的同时拥有更快的收敛速度;同时针对传统粒子群更新时不考虑特征的数量问题,提出了新的粒子更新策略,兼顾了分类准确度和选择的信息SNP数量。实验结果表明,对比特征选择方法K-MIGS/PSO、K-MIGS/ACO、K-MIGS/GA和ReliefF、MCMR,使用K-MIGS/BH-PSO生成的信息SNP子集具有更高的SNP重构准确度和更少的SNP个数,并且在最后使用支持向量机、随机森林和神经网络对生成的信息SNP子集进行的分类实验中准确率提升了2.18%~5.01%,再次说明了K-MIGS/BHPSO特征选择算法在信息SNP生成中具有更好的作用。(3)针对传统SNP编码模式不能有效利用SNP数据上下游生物学信息及传统深度学习分类模型应用到精神分裂症诊断上时准确率不能达到辅助医疗要求的问题,对原有深度信念网络作出以下改进:一方面将传统的SNP数据0-1-2编码模式替换为新的Triad-SNP编码,该编码模式将需要编码的SNP及上下游SNP结合构成三元SNP编码,使其SNP序列可以直接作为后续深度模型的输入;另一方面,充分利用SNP簇标签信息,将原始限制玻尔兹曼机隐含层分割为多个区,并建立分区DBN网络,用以学习属于每个不同簇的SNP数据。最后的两个实验表明三元分区深度信念网络在对精神分裂症的诊断标准上较其他模型有着显著提升,分别在准确率和F1标准上提升了6.30%~7.49%和7.27%~12.51%。


知网文化
【相似文献】
中国期刊全文数据库 前14条
1 吴梦;杨明;马琳;叶绍辉;;产蛋和停产武定鸡卵巢转录组SNP分析[J];中国家禽;2020年03期
2 李凯航;赵乐乐;陆雪林;徐卫彬;李何君;薛云;吴昊旻;邢磊;;基于SNP芯片的浦东鸡保种分析[J];中国家禽;2020年06期
3 邹乐勤;曾令湖;杨祝良;孙甜甜;徐文文;罗鑫莲;邓继贤;肖聪;王娟;杨秀荣;;不同周龄南丹瑶鸡蛋壳颜色相关SNP的筛选[J];中国家禽;2020年07期
4 蒋红云;马骥;;乳腺癌相关SNP分子标记专利技术综述[J];江西化工;2020年04期
5 雒林通;马芳;唐德富;包晓娟;;基于益生菌调节的太平鸡回肠SNP位点分析[J];安徽农业科学;2020年21期
6 张磊;戈小虎;史振峰;;血栓闭塞性脉管炎的SNP靶点分析研究[J];新疆医科大学学报;2020年11期
7 焦雪;张培军;冷东泽;王建超;巴翠玉;李月红;;2株温和气单胞菌SNP位点比较分析[J];中国兽医学报;2017年03期
8 招丽蓉;王巍;伍婧;胡斌;林秀强;徐绮华;林奔;冯芬;陈永昌;;VEGF的SNP状态预测贝伐株单抗治疗转移性结直肠癌的长期疗效[J];实用癌症杂志;2017年04期
9 闫晓玲;李会彬;孙鑫博;边秀举;王丽宏;;低温层积和SNP处理对白颖薹草种子萌发的影响[J];种子;2017年05期
10 王丽丽;林余霖;陈晓辰;廖保生;王晓玥;金钺;韩建萍;;基于SNP位点鉴定藏菖蒲及其近缘种[J];中国现代中药;2014年11期
11 王文斌;徐淑兔;高杰;张兴华;郭东伟;李向阳;薛吉全;;基于SNP标记的玉米自交系遗传多样性分析[J];玉米科学;2015年02期
12 戴崝;;基于SNP框架的“抗生素”主题活动构建与思考[J];中国校外教育;2019年S1期
13 丛晓霏;丁君;常亚青;;虾夷马粪海胆溶菌酶基因SNP标记的开发及多态性分析[J];中国农业科技导报;2012年05期
14 康闽;王宏伟;程佩萱;;幼年特发性关节炎患儿甘露糖结合凝集素基因启动子区SNP研究[J];中国优生与遗传杂志;2006年04期
中国重要会议论文全文数据库 前20条
1 孙发宇;骆孟;李磊;李韬;;小麦硒耐性和SNP的关联分析[A];江苏省遗传学会2017年学术研讨会——“技术创新与遗传学发展”论文摘要集[C];2017年
2 杜珍武;沈笛寒;杨麒巍;隋玉杰;宋旸;张桂珍;;分子数据库整合分析2型糖尿病发病相关的SNP及功能[A];第十六届中国体视学与图像分析学术会议论文集——交叉、融合、创新[C];2019年
3 王世维;刘琳琳;原恺;郭芳芳;杨仕新;柳慧;杨藜;孙涛;吴波明;;稻瘟病菌基因组变异因子SNP检测[A];植保科技创新与农业精准扶贫——中国植物保护学会2016年学术年会论文集[C];2016年
4 王沙沙;陈锋;崔党群;;普通小麦籽粒大小相关基因SNP突变对产量相关性状的影响[A];第六届全国小麦基因组学及分子育种大会论文集[C];2015年
5 周晋;王树叶;曹峰林;王巍;李丽敏;;阵发性睡眠性血红蛋白尿的SNP的研究[A];第十一届全国红细胞疾病学术会议暨学习班论文汇编[C];2007年
6 于茜;李仰平;邢强;李雪;胡晓丽;包振民;;皱纹盘鲍(Haliotis discus hannai)基因组预测序及群体间差异SNP位点的筛查[A];遗传多样性:前沿与挑战——中国的遗传学研究(2013-2015)——2015中国遗传学会大会论文摘要汇编[C];2015年
7 汪纯;何进卫;傅文贞;章振林;;16个骨质疏松候选基因133个SNP与绝经后妇女骨质疏松性骨折的相关性研究[A];中华医学会第六次全国骨质疏松和骨矿盐疾病学术会议暨中华医学会骨质疏松和骨矿盐疾病分会成立十周年论文汇编[C];2011年
8 朱红艳;李先明;伍涛;杨夫臣;涂俊凡;秦仲麒;;梨抗黑斑病SNP标记及候选基因筛选[A];中国植物病理学会2015年学术年会论文集[C];2015年
9 王珊;包振民;胡晓丽;苏海林;贺艳;张月月;李艳;付晓腾;;基于454测序的栉孔扇贝(Chlamys farreri)基因和SNP筛查[A];中国动物学会、中国海洋湖沼学会贝类学会分会第十四次学会研讨会论文摘要汇编[C];2009年
10 王珊;包振民;胡晓丽;贺艳;任晓亮;张月月;;基于454测序的栉孔扇贝(Chlamys farreri)基因和SNP筛查[A];2008年中国水产学会学术年会论文摘要集[C];2008年
11 张强;唐斌;何芳;王树人;邹放君;王刚;石晓鹏;杨剑锋;王振焕;陈雄英;邓峰美;;内皮型一氧化氮合酶基因标签SNP多态性与新疆哈萨克族原发性高血压的关联研究[A];第八届海峡两岸心血管科学研讨会论文集[C];2011年
12 刘建新;;外源一氧化氮供体SNP对盐胁迫下多年生黑麦草幼苗根生长抑制和氧化损伤的缓解效应[A];第十届中国科协年会论文集(三)[C];2008年
13 高丽锋;孔秀英;贾继增;;小麦SNP分子条形码的开发与利用[A];第六届全国小麦基因组学及分子育种大会论文集[C];2015年
14 王琦;徐洁;卢艳丽;;玉米基因组影响蛋白结构与基因分子功能的SNP鉴定[A];第一届全国玉米生物学学术研讨会论文汇编[C];2015年
15 刘小献;白俊杰;于凌云;;草鱼高通量测序SNP筛选及初步分析[A];2010年中国水产学会学术年会论文摘要集[C];2011年
16 何超;聂庆华;张细权;;用Z染色体SNP标记分析鸡的遗传多样性[A];第十次全国畜禽遗传标记研讨会论文集[C];2006年
17 鞠志花;王洪梅;李秋玲;黄金明;李建斌;安利国;杨桂文;仲跻峰;王长法;;中国荷斯坦牛κ-酪蛋白基因两SNP位点基因型组合对产奶性状的影响[A];中国牛业健康发展与科技创新——中国畜牧兽医学会第七届养牛学分会2009年学术研讨会论文集[C];2009年
18 包永波;李莉;张国范;;海湾扇贝超氧化物歧化酶基因家族SNP多态性和鳗弧菌易感性初步分析[A];中国动物学会、中国海洋湖沼学会贝类学会分会第十四次学会研讨会论文摘要汇编[C];2009年
19 李松;刘洪娜;刘丽赏;邓燕;何农跃;;基于通用连接子的全基因组扩增技术的SNP分型方法[A];遗传学进步与人口健康高峰论坛论文集[C];2007年
20 张瑞奇;姚若男;范亚丽;穆换清;熊传曦;冯祎高;邢莉萍;曹爱忠;;小麦SNP芯片标记在外源基因发掘中的应用[A];第十届全国小麦基因组学及分子育种大会摘要集[C];2019年
中国博士学位论文全文数据库 前20条
1 刘松;系统性鉴定调控肿瘤风险的SNP变异[D];北京协和医学院;2017年
2 Haile Berihulay Gebreselase;全基因组重测序和SNP芯片对埃塞俄比亚和中国山羊群体的全基因组种质特性研究[D];中国农业科学院;2019年
3 谢健;基于高密度SNP芯片的香猪产仔数性状基因筛选和鉴定[D];贵州大学;2016年
4 褚延广;欧洲黑杨(Populus nigra L.)水、光资源高效利用相关单核苷酸多态性(SNP)研究[D];中国林业科学研究院;2009年
5 李振丽;基于SNP芯片技术的结直肠癌全基因组罕见拷贝数变异研究及相关基因的临床意义探索[D];浙江大学;2016年
6 代平;文蛤(Meretrix meretrix)选育群体的遗传测定及生长相关SNP鉴定[D];中国科学院研究生院(海洋研究所);2014年
7 康晓军;基因序列比对算法在SNP中的研究及应用[D];华中农业大学;2011年
8 牛晖;不同品种牛群子宫内膜炎流行病学调查及其SNP差异分析[D];吉林大学;2016年
9 陈垚文;人类肠道宏基因组SNP模式与疾病的关联研究[D];中国人民解放军军事医学科学院;2017年
10 黄建安;茶树分子遗传图谱构建及多酚氧化酶基因的SNP研究[D];湖南农业大学;2004年
11 许琪;多巴胺代谢通路上的SNP型组合与偏执型精神分裂症的系统关联分析[D];中国协和医科大学;2004年
12 乔贤;绒山羊SNP芯片设计及重要经济性状全基因组关联分析研究[D];内蒙古农业大学;2020年
13 Adam Abied;基于高密度SNP芯片对苏丹和中国绵羊群体的全基因组种质特性研究[D];中国农业科学院;2020年
14 徐冬雪;仿刺参热胁迫响应的分子调控特征研究与SNP标记筛选[D];中国科学院研究生院(海洋研究所);2016年
15 张建勇;中国对虾(Fenneropenaeus chinensis)基因组SNP标记的开发与应用[D];中国海洋大学;2011年
16 朱国忠;基于转录组测序和SNP芯片开展棉花耐盐特征分析[D];南京农业大学;2017年
17 孙杨;ABCC11基因SNP在腋臭发病中作用机制的研究及临床应用的探索[D];中南大学;2014年
18 吴丽莎;BSG基因功能性SNP与银屑病易感性的关联分析及生物学效应研究[D];中南大学;2011年
19 陈飞宇;FANCD2通路乳腺癌遗传易感基因SNP与乳腺癌发病风险的关联分析[D];中南大学;2013年
20 洪韬;GWAS研究SNP位点与中国人群HIV-1感染者疾病进程和疗效相关性研究[D];北京协和医学院;2010年
中国硕士学位论文全文数据库 前20条
1 邢斌;基于SNP的特征选择及精神分裂症诊断模型研究[D];江苏大学;2020年
2 张洪丽;基于精神分裂症SNP点的初步研究与实现[D];吉林大学;2009年
3 赵剑;基于互信息频度的特征选择及其在SNP关联分析中的应用[D];西安电子科技大学;2009年
4 胡安琪;基于SNP的桃金娘种质资源遗传多样性研究[D];广东海洋大学;2020年
5 王聿双;外源SNP对镉胁迫下向日葵幼苗生理生化及差异蛋白的影响分析[D];天津农学院;2019年
6 陈艳梅;红掌高密度SNP遗传连锁图谱构建及疫病抗性佛焰苞花色性状QTL定位[D];海南大学;2018年
7 江泓慧;应用SNP遗传标记鉴别蒙古狼和家犬的方法研究[D];东北林业大学;2019年
8 朱皓晨;SNP与疾病关联关系的研究与应用[D];西安电子科技大学;2019年
9 支越胜;基于SNP推测四川和内蒙汉族人群身高的遗传学研究[D];新乡医学院;2019年
10 顾鑫;SNP选择技术及精神分裂症诊断系统的设计与实现[D];江苏大学;2019年
11 曹维;BnGRF7c基因的功能研究及其SNP分子标记开发[D];江苏大学;2019年
12 张波;基于SNP数据的精神分裂症的诊断模型研究与系统实现[D];江苏大学;2019年
13 彭莉;GWAS候选SNP与中国人群非综合征性唇腭裂的关联研究[D];上海交通大学;2016年
14 贺思程;标签SNP集分析方法在全基因组关联研究中的应用[D];中国石油大学(华东);2017年
15 吕爽;MTX治疗RA副作用相关SNP的Meta分析及其与寒热证型相关性研究[D];北京中医药大学;2019年
16 刘家鑫;利用不同密度SNP芯片进行绵羊全基因组ROH检测及候选基因鉴定[D];中国农业科学院;2019年
17 周东珂;绵羊高密度SNP芯片GGP OvineHD的设计[D];西北农林科技大学;2019年
18 陆信蓓;SNP选择的关键技术及精神分裂症诊断模型研究[D];江苏大学;2019年
19 彭丹;细胞色素P450基因家族SNP与抗结核药物性肝损伤的相关性研究[D];南华大学;2018年
20 揭英纯;骨连接蛋白标签SNP与冠心病遗传易感性和临床表型的关联分析[D];南方医科大学;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978