收藏本站
《南京理工大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质相互作用位点及亚细胞定位预测研究

刘光徽  
【摘要】:蛋白质是生物生命活动的物质基础和体现者,对蛋白质结构和功能以及蛋白质相互作用机制的研究有助于人们从分子水平上认识生命运行的机制,阐明各种疾病发病的机理,进而找到新的药物治疗手段。传统的实验方法对于蛋白质相关功能的研究步伐无法满足海量蛋白质分析的需求。基于机器学习的生物信息学研究方法逐渐受到了人们的重视。蛋白质相互作用以及蛋白质亚细胞定位都是蛋白质组学和蛋白质功能研究的重要内容,而蛋白质数据的复杂程度越来越高,层出不穷的新问题亟需找到新的解决方法,各种新挑战对预测算法提出了更高的要求。在这一背景下,本文从生物信息学和机器学习的角度对基于序列的蛋白质相互作用位点预测以及基于图像的蛋白质亚细胞定位的预测进行了深入的研究。从模式识别上来讲蛋白质之间作用位点的预测是类别不平衡的二分类问题;而亚细胞定位的预测是将蛋白质定位在很多个不同的亚细胞上,是多分类问题。因此,本文先探讨使用不同方法处理基于序列的蛋白质相互作用位点预测中的二分类不平衡问题,然后在基于图像的蛋白质亚细胞定位的预测上提出了新的特征提取方法和新的分类器算法来处理多分类问题。从而实现从二分类到多分类的进一步研究。本文的主要工作可以归纳如下:(1)提出一种数据清洗和后过滤处理的方法。该方法针对基于序列的蛋白质相互作用位点预测中存在的类别不平衡的问题,通过一个随机森林模型从原始训练数据集的多数类样本(非相互作用残基)里去除那些识别困难的边缘目标,以减轻相互作用点与非相互作用点之间不平衡的严重程度;再应用后过滤程序将预测引擎得到的结果中相对孤立的作用点去掉,以此来进一步降低预测的假阳性率。基准数据集上详尽的交叉验证和独立验证实验都证明了该力法缓解类不平衡问题的能力,与已有的最新的蛋白质相互作用位点预测器的比较显示了这种方法的有效性。(2)提出一种基于多普勒效应蝙蝠算法进行聚类下采样的方法。该方法针对基于序列的蛋白质相互作用位点预测中类别不平衡样本随机下采样容从造成重要信息丢失的问题,通过一种基于多普勒效应蝙蝠算法的聚类下采样算法来保证样本分布信息的完整性。首先将训练样本中的少数类样本(相互作用残基)和多数类样本(非相互作用残基)分开,然后使用多普勒效应蝙蝠算法对多数类样本进行聚类,得到几个聚类簇,计算它们的样本中心,通过从不同的聚类中心选取总数目和少数类样本数目相当的多数类样本来实现下采样。这样既保留了原始样本的分布信息,又降低了类别之间的不平衡程度。该方法给出了预测模型,在基准数据集上的交叉验证和独立验证实验结果都证明了该方法能有效地缓解类不平衡的问题。(3)提出一种基于多视角图像特征的亚细胞定位多类别预测方法。该方法针对免疫组化(IHC)图像中蛋白质和DNA的特征提取问题,通过基于多视角方式引入一些目前基于图像的亚细胞定位预测方法中未使用过的图像特征,并将原始图像特征和图像分割后的特征组合在一起来提升亚细胞定位预测的性能。该方法从原始图像视角分别提取四种纹理特征;从颜色分割后的蛋白质通道视角提取蛋白质的全局特征和局部特征;以及从DNA通道视角提取DNA的全局特征。又将所提取的单个特征分别进行组合,并使用逐步判别分析法进行特征选择。通过四种基本分类器在训练数据集上对单个特征以及组合特征分别进行十折交叉验证实验,最后找到最优的特征组合。基于得到的特征组合,为进一步提升预测结果,提出一种栈式自动编码器和随机森林相结合的分类器方法,该分类器将多层次网络与传统统计分类方法融合在一起。在训练数据集和独立测试集上与近年来出现的基于图像的蛋白质亚细胞定位预测方法的比较都证明了提出方法的有效性。
【学位授予单位】:南京理工大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:Q51;TP391.41

【参考文献】
中国期刊全文数据库 前5条
1 肖辉辉;段艳明;;基于DE算法改进的蝙蝠算法的研究及应用[J];计算机仿真;2014年01期
2 段华;汤春明;;基于区域生长的生物图像分割方法[J];仪器仪表用户;2007年03期
3 刘印锋,葛华勇,王保华;医学显微图像的数字化技术[J];中国医疗器械信息;2005年03期
4 林开颜,徐立鸿,吴军辉;快速模糊C均值聚类彩色图像分割方法[J];中国图象图形学报;2004年02期
5 戴青云,余英林;一种基于小波与形态学的车牌图象分割方法[J];中国图象图形学报;2000年05期
中国博士学位论文全文数据库 前1条
1 施建宇;蛋白质亚细胞定位特征表达与分类算法研究[D];西北工业大学;2006年
中国硕士学位论文全文数据库 前1条
1 陈军;基于Gabor小波变换的人脸识别技术研究[D];东北大学 ;2009年
【共引文献】
中国期刊全文数据库 前10条
1 韩斐斐;刘升;王兴凡;;融合正弦余弦的蝙蝠算法[J];智能计算机与应用;2018年03期
2 李倩;陈亮;李长英;朱元凯;;差分蝙蝠算法在精准扶贫中的应用[J];泰山学院学报;2018年03期
3 翁健高;李道丰;白琳;易向阳;;一种融合粒子群算法的蝙蝠优化算法[J];广西大学学报(自然科学版);2018年02期
4 郭旭;贺兴时;高昂;;一种基于权重策略的蝙蝠算法[J];纺织高校基础科学学报;2018年01期
5 杨红亚;赵景秀;徐冠华;刘爽;;彩色图像分割方法综述[J];软件导刊;2018年04期
6 江方利;黄炜斌;李基栋;刘刚;陈仕军;马光文;;基于改进蝙蝠算法的梯级水电站经济调度[J];工程科学与技术;2018年02期
7 张晓琪;胡振;唐天国;;改进蝙蝠算法在模糊层次分析中的应用[J];计算机系统应用;2018年03期
8 杜艳艳;刘升;;带有高斯变异的Lévy飞行改进蝙蝠算法[J];微电子学与计算机;2018年03期
9 吕赵明;张颖江;;改进的新型蝙蝠算法[J];计算机技术与发展;2018年05期
10 张于贤;薛殿春;丁修坤;程书瑞;;应用改进萤火虫算法求解基于学习退化效应的PFSP问题[J];系统科学学报;2017年04期
中国博士学位论文全文数据库 前2条
1 向其林;基于新型表达模式的序列特征获取方法及应用研究[D];湖南大学;2017年
2 刘光徽;蛋白质相互作用位点及亚细胞定位预测研究[D];南京理工大学;2017年
中国硕士学位论文全文数据库 前9条
1 王磊;人脸识别的智能门禁系统的研究与设计[D];西安工业大学;2017年
2 孙亚楠;基于环形对称Gabor变换和稀疏表示的人脸识别算法研究[D];山东大学;2017年
3 张冲;基于云服务和人脸识别的在线组卷、考试和阅卷系统[D];天津工业大学;2016年
4 程楠;基于人工神经网络的电力SCADA系统的故障诊断[D];沈阳理工大学;2016年
5 胡金裕;基于改进LBP特征和人脸能量图的多姿态人脸识别研究[D];哈尔滨工程大学;2015年
6 朱劲强;基于稀疏表示的人类口型识别[D];南昌大学;2014年
7 高原;门禁考勤系统中人脸识别的研究[D];武汉理工大学;2012年
8 刘振环;人眼变化信息检测技术研究[D];沈阳理工大学;2012年
9 尹帮治;基于Gabor和SVM的光照鲁棒人脸识别算法研究[D];华南理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 张宇楠;刘付永;;一种改进的变步长自适应蝙蝠算法及其应用[J];广西民族大学学报(自然科学版);2013年02期
2 刘长平;叶春明;;具有混沌搜索策略的蝙蝠优化算法及性能仿真[J];系统仿真学报;2013年06期
3 黄光球;赵魏娟;陆秋琴;;求解大规模优化问题的可全局收敛蝙蝠算法[J];计算机应用研究;2013年05期
4 李明;曹德欣;;混合CS算法的DE算法[J];计算机工程与应用;2013年09期
5 盛晓华;叶春明;;蝙蝠算法在PFSP调度问题中的应用研究[J];工业工程;2013年01期
6 贾盼龙;田学民;;基于自适应小生境的改进入侵性杂草优化算法[J];上海电机学院学报;2012年04期
7 郑洪清;周永权;;一种自适应步长布谷鸟搜索算法[J];计算机工程与应用;2013年10期
8 刘佳昆;周永权;;一种最大最小萤光素值人工萤火虫算法[J];计算机应用研究;2011年10期
9 姜浩;韩亚利;成礼智;;基于区间—遗传算法求解非线性方程组[J];计算机工程与应用;2009年25期
10 孙家泽;张建科;;求解非线性方程组的社会认知算法[J];计算机工程与应用;2008年28期
中国博士学位论文全文数据库 前2条
1 张绍武;基于支持向量机的蛋白质分类研究[D];西北工业大学;2004年
2 靳利霞;蛋白质结构预测方法研究[D];大连理工大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 王吉村,药立波;从蛋白质相互作用研究方法的发展看人们认识事物的过程[J];医学与哲学;2000年05期
2 梁琳慧,韩忠朝;蛋白质相互作用的研究方法[J];生命的化学;2005年03期
3 唐泽耀,戴淑芳,陈华,林原;蛋白质相互作用研究的哲学思考[J];医学与哲学;2005年01期
4 曹建平,马义才,李亦学,石铁流;计算方法在蛋白质相互作用研究中的应用[J];生命科学;2005年01期
5 谢江;张武;梅健;顾知立;吴继宗;李辉;张律文;;一种新的计算预测alpha-synuclein蛋白质相互作用网络的方法(英文)[J];Journal of Shanghai University(English Edition);2008年06期
6 余鑫煜;许正平;;蛋白质相互作用数据库及其应用[J];中国生物化学与分子生物学报;2008年03期
7 刘中扬;李栋;朱云平;贺福初;;蛋白质相互作用网络进化分析研究进展[J];生物化学与生物物理进展;2009年01期
8 王正华;董蕴源;王勇献;;蛋白质相互作用网络的几种聚类方法综述[J];国防科技大学学报;2009年04期
9 陆林英;魏雅卓;崔颖;孙平平;马雅楠;马志强;;基于支持向量机的蛋白质相互作用识别[J];生物信息学;2009年04期
10 王建新;蔡钊;李敏;;一种基于极大团的蛋白质相互作用预测方法[J];高技术通讯;2009年01期
中国重要会议论文全文数据库 前10条
1 刘珍;孙景春;谢锦云;李亦学;梁宋平;石铁流;;蛋白质相互作用网络中的生物途径分析[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
2 李占潮;周漩;戴宗;邹小勇;;基于一级结构信息预测蛋白质与蛋白质相互作用[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
3 王存新;马晓慧;陈慰祖;;构象熵对蛋白质-蛋白质相互作用及结合自由能的贡献[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
4 程钢;吴松锋;陈廷贵;万平;朱云平;贺福初;;22周孕龄胎肝蛋白质相互作用网络的构建[A];中国蛋白质组学首届学术大会论文摘要集[C];2003年
5 杨晓明;王建;许望翔;虞东辉;杨永升;刘琼明;周颖;张翠莉;吴志豪;张万巧;刘涛;唐刘君;原艳芝;郝峰;金超智;贺福初;;人类肝脏重要蛋白质相互作用连锁图研究进展[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
6 吴俊;邓宏钟;朱大智;谭跃进;;蛋白质相互作用网络的度秩函数与度分布[A];2006全国复杂网络学术会议论文集[C];2006年
7 李令东;田瑞军;唐伟;邹汉法;赵宗保;;携异戊烯链小分子与蛋白质相互作用的研究[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
8 李立;肖奕;孙之荣;;酵母蛋白质相互作用网络的模块进化[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
9 陈慰祖;庄彦;王存新;;用分子模拟方法研究胰岛素二聚体的相互作用和识别[A];第三届全国现代生物物理技术学术讨论会论文摘要汇编[C];2000年
10 马文;刘艳清;郭琼;邓玉林;;生物功能化色谱法研究胰岛素及其受体间的相互作用[A];第十五次全国色谱学术报告会文集(上册)[C];2005年
中国重要报纸全文数据库 前10条
1 记者 常丽君;科学家绘制出迄今最详细蛋白质相互作用图[N];科技日报;2011年
2 胡德荣;蛋白质相互作用网络预测新方法被发现[N];健康报;2007年
3 通讯员 甄蓓 特约记者 吴志军;肝脏蛋白质相互作用图绘出[N];健康报;2011年
4 甄蓓;我科学家成功绘制人类肝脏蛋白质相互作用网络连锁图[N];科技日报;2011年
5 甄蓓;人类肝脏蛋白质“关系网络图”绘成[N];中国医药报;2011年
6 毛黎;美开发细胞内蛋白质相互作用标识技术[N];科技日报;2007年
7 张佳星;人类为何如此与众不同[N];科技日报;2008年
8 白毅;我国计算生物学研究取得重要进展[N];中国医药报;2007年
9 余志平 编译;PCAs给我们带来了什么?[N];中国医药报;2007年
10 欣文;蛋白质相互作用导致疑难病症[N];医药经济报;2002年
中国博士学位论文全文数据库 前10条
1 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年
2 梁治;蛋白质相互作用网络的比较生物学分析及其应用[D];中国科学技术大学;2006年
3 王晓敏;基于蛋白质相互作用网络的功能模块识别及功能预测研究[D];国防科学技术大学;2013年
4 胡静;基于密度聚类和特征分类的蛋白质相互作用热区预测[D];武汉科技大学;2015年
5 李满生;蛋白质相互作用文献挖掘方法、注释体系及挖掘平台研究[D];中国人民解放军军事医学科学院;2016年
6 魏志森;蛋白质相互作用位点预测方法研究[D];南京理工大学;2016年
7 刘光徽;蛋白质相互作用位点及亚细胞定位预测研究[D];南京理工大学;2017年
8 谢江;蛋白质相互作用网络的数值研究[D];上海大学;2008年
9 史明光;蛋白质相互作用预测方法的研究[D];中国科学技术大学;2009年
10 杜秀全;基于智能计算的蛋白质相互作用预测方法研究[D];安徽大学;2010年
中国硕士学位论文全文数据库 前10条
1 董蕴源;基于谱方法的蛋白质相互作用网络分析[D];国防科学技术大学;2007年
2 邴志桐;蛋白质相互作用网络度分布的研究[D];兰州大学;2009年
3 杨晓飞;基于多源数据融合的蛋白质—蛋白质相互作用网络构建方法研究[D];中国科学技术大学;2009年
4 刘喆;人类蛋白质相互作用数据库可靠性的衡量[D];天津大学;2009年
5 李满生;基于本体的蛋白质相互作用信息文本挖掘方法研究[D];中国人民解放军军事医学科学院;2010年
6 毕敬业;基于序列的蛋白质相互作用预测方法研究[D];山西大学;2013年
7 步淑杰;基于非变性微型2DE-网格凝胶切取—定量LC-MS/MS蛋白质相互作用组学方法的建立及人类血浆蛋白质的分析[D];华南理工大学;2015年
8 庄雪琴;大图理论在蛋白质相互作用网络比对中的应用[D];南京理工大学;2015年
9 陈白雪;体外进化ATP结合蛋白的初步功能研究[D];华中农业大学;2015年
10 董美豪;基于文本挖掘的蛋白质相互作用对抽取方法的研究[D];哈尔滨工业大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026