收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质残基相互作用预测及其在结构建模中的应用研究

杨静  
【摘要】:在后基因组时代,蛋白质组学已成为非常重要的研究热点之一。蛋白质作为生命活动的重要载体,对其三维结构进行解析有助于了解蛋白质功能,进而深入理解各种生命现象的本质。蛋白质结构在药物设计和蛋白质设计等方面也有着广泛的应用,然而,相对于已经测定出的蛋白质序列的数量,已知蛋白质结构的数量相对甚少,并且蛋白质序列和结构数量之间的差距日益增大。幸运的是,随着生物大数据的不断积累以及模式识别方法特别是深度学习技术的快速进步,使得直接基于蛋白质序列快速准确地从头预测出蛋白质结构成为可能。由于蛋白质结构预测具有速度快及成本低等优点,它已然成为通过理论实验解析蛋白质结构的一种补充方法。在预测蛋白质三维结构的过程中,空间约束起着关键的作用,如角度和距离约束等,它们可以大幅降低构象空间的熵,以达到优化蛋白质结构的目的。蛋白质残基网络中的相互作用信息,特别是长距离的相互作用,能够协助结构建模算法计算出高质量的构象空间。研究表明,二硫键作为一种特殊的残基相互作用,在蛋白质折叠过程中至关重要。近些年来,科研人员利用各种模式识别方法开发了多种蛋白质残基相互作用预测模型,并成功地把预测结果转化为空间距离约束条件优化三维结构模型。但在实际应用中,对于相似序列较少的蛋白质,如何精确地预测残基之间的相互作用信息,一直困扰着研究人员,因为从序列中提取到的特征并不准确。当前,绝大多数预测模型仅适用于水溶性蛋白,对于膜蛋白残基相互作用预测的研究相对较少,这是由于已知膜蛋白的结构很少,因而没有足够的样本训练出高质量的预测模型。本文直接从蛋白质序列出发,基于机器学习和数据挖掘技术,主要研究对象是蛋白质残基之间的相关性,包括水溶性蛋白和膜蛋白中的残基相互作用以及二硫键连接模式。除此之外,还研究了空间距离约束在蛋白质三维结构建模中的应用。本文主要的研究内容与创新点如下:一、提出了基于动态决策的蛋白质残基相互作用预测算法R_2C。本文研发了一种动态融合策略,充分利用有监督的机器学习法和无监督的相关性分析法的优点,针对不同的输入采取不同的线性融合权重,提高了预测残基相互作用的正确率。全局相关性分析算法能够有效去除因传递噪声带来的假阳性,然而,在其输出中仍然可以观察到高斯噪声,本文首次应用高斯滤波模型进一步优化相关性分析法的输出,强化了长距离残基相互作用的预测正确率。二、构建了基于卷积神经网络的残基相互作用预测模型MemBrain。在膜蛋白中,跨膜螺旋间的残基相互作用信息对结构建模更加重要,因而得到了更多的关注。现有方法只用跨膜螺旋间的残基对训练模型,然而本文则使用全序列的样本训练机器学习模型。一方面可以增加训练样本,另一方面预测模型将有能力计算全序列的残基相互作用。由蛋白质三维结构的固有特性决定了残基相互作用信息是密集分布的,据此,MemBrain预测模型被设计成两级的架构,第一级用于预测序列中每个残基对发生相互作用的概率,第二级则以待测残基对及其邻域内的残基对的初始概率为输入,利用卷积神经网络挖掘隐含在其中的相互作用关联模式,从而大幅地提高了预测残基相互作用的正确率。三、开发了基于降阶方法的Cyscon模型以预测二硫键连接模式。二硫键可能的连接模式数量与蛋白质序列中二硫键的数量呈指数正相关,当序列中含有5个以上的二硫键时,当前的预测算法都难以正确预测出其连接模式。针对这一难题,本文创新地引入了降阶的思想,即首先基于序列比对的方法找出待测序列中较为保守的二硫键,然后再用传统的机器学习法预测出序列中剩余的二硫键。在该框架下,一方面预测模型能够处理包含更多二硫键的蛋白质序列,另一方面提高了二硫键连接模式的预测正确率。基于Cyscon的预测结果,本文首次系统地验证了二硫键作为空间距离约束能够提高蛋白质三维结构建模的精度。四、设计了基于穷尽约束搜索的算法ExSSO用于辅助核磁共振(NMR)实验解析膜蛋白结构。与蛋白质残基网络中的相互作用信息不同,利用NMR技术测得的NOE(Nuclear Overhauser Enhancement)距离约束非常可靠,但是却具有双向不确定性。本文在已知跨膜多聚体的单体结构以及单体数量的条件下,利用不确定的NOE约束穷尽地筛选跨膜多聚体的构象空间。ExSSO通过对欧拉角的均匀采样,实现了对单体结构朝向近乎完全地搜索,最后通过聚类的方法计算出具有代表性的结构,有效地避免显式求解每个NOE约束的方向。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 ;降低机器学习门槛的六大工具[J];电脑知识与技术(经验技巧);2019年10期
2 胡思润;杨晓旭;宋靖华;;基于机器学习的城市生成方法研究[J];智能建筑与智慧城市;2019年11期
3 李兵;林文钊;罗峥尹;;基于机器学习的智慧农业决策系统设计与实现[J];信息与电脑(理论版);2018年24期
4 舒娜;刘波;林伟伟;李鹏飞;;分布式机器学习平台与算法综述[J];计算机科学;2019年03期
5 刘传会;汪小亚;郭增辉;;机器学习在反洗钱领域的应用与发展[J];清华金融评论;2019年04期
6 孟雨;;机器学习让计算机更智能[J];计算机与网络;2019年14期
7 高华川;;机器学习在经济学中的应用[J];纳税;2019年24期
8 李阳;;机器学习在网络空间安全研究中的应用分析[J];电脑知识与技术;2019年24期
9 朱辉;;机器学习在企业级场景中的实践与探讨[J];中国建设信息化;2018年03期
10 彭传意;;机器学习——我们该如何与机器竞争[J];数字通信世界;2018年01期
11 陈轶翔;埃里克·布伦乔尔森;汤姆·米切尔;;机器学习的能力范围及其对劳动力的影响[J];世界科学;2018年04期
12 赵长林;;机器学习即服务[J];网络安全和信息化;2017年10期
13 ;机器学习作用于信息安全的五大顶级案例[J];网络安全和信息化;2018年01期
14 吴承杨;;2018年来说说机器学习[J];软件和集成电路;2018年05期
15 宋雯博;;大数据下的机器学习的应用趋势[J];电脑迷;2018年09期
16 吴炜;孙强;;应用机器学习加速新材料的研发[J];中国科学:物理学 力学 天文学;2018年10期
17 宋明成;;机器学习隐私的安全隐患[J];计算机与网络;2018年16期
18 游思奇;;解读机器学习与深度学习的发展及应用[J];计算机产品与流通;2018年05期
19 黄乃静;于明哲;;机器学习对经济学研究的影响研究进展[J];经济学动态;2018年07期
中国重要会议论文全文数据库 前10条
1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
2 王衍鲁;张利会;张淑洁;石洁茹;王鹏;;大学新生学校适应的个体与环境因素探究:基于机器学习的考察[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年
3 张长水;;大数据机器学习[A];2015年中国自动化大会摘要集[C];2015年
4 何琳;侯汉清;;基于标引经验和机器学习相结合的多层自动分类[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
6 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
7 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
8 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 ;基于机器学习的大数据防诈骗能力研究与应用[A];2018中国信息通信大会论文摘要集[C];2018年
10 ;基于机器学习的影响感知无线根因问题快速定位研究[A];2018中国信息通信大会论文摘要集[C];2018年
中国博士学位论文全文数据库 前10条
1 殷曦;基于机器学习及统计计算模型的膜蛋白结构预测[D];上海交通大学;2017年
2 杨静;蛋白质残基相互作用预测及其在结构建模中的应用研究[D];上海交通大学;2018年
3 王磊;基于机器学习的药物—靶标相互作用预测研究[D];中国矿业大学;2018年
4 张庆;钙钛矿型功能材料的基因组工程研究[D];上海大学;2018年
5 管月;医学肿瘤影像分类算法研究及其在肝癌上的应用[D];南京大学;2018年
6 郝小可;基于机器学习的影像遗传学分析及其应用研究[D];南京航空航天大学;2017年
7 施建明;基于机器学习的产品剩余寿命预测方法研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2018年
8 陈再毅;机器学习中的一阶优化算法收敛性研究[D];中国科学技术大学;2018年
9 陆海进;Zr合金热动力学研究及机器学习[D];上海大学;2018年
10 戴望州;一阶逻辑领域知识与机器学习的结合研究[D];南京大学;2019年
中国硕士学位论文全文数据库 前10条
1 孟圣然;基于机器学习的机械产品结构建模技术研究[D];杭州电子科技大学;2019年
2 华琪;基于机器学习的智能建筑行为建模与预测方法研究[D];上海交通大学;2017年
3 杨浩;基于机器学习的白带菌类光学图像识别算法研究[D];电子科技大学;2019年
4 王维;心音诊断信息自动识别方法研究[D];电子科技大学;2019年
5 徐安;基于机器学习的慢性疾病预测关键技术研究[D];电子科技大学;2019年
6 宋同峰;基于机器学习的肾病辅助诊断系统的研究[D];青岛科技大学;2019年
7 王婧;基于核机器学习的阿尔兹海默病早期诊断算法研究[D];曲阜师范大学;2019年
8 马小凤;机器学习在学生通过率预测中的应用研究[D];西南大学;2019年
9 黄雨迪;基于机器学习的MIMO系统收发机设计理论与方法[D];电子科技大学;2019年
10 应豪;基于机器学习的光纤信道均衡技术研究[D];电子科技大学;2019年
中国重要报纸全文数据库 前10条
1 CIO.com资深作家 Clint Boulton 编译 Charles;领先一步:机器学习的10个成功案例[N];计算机世界;2018年
2 Bob Violino 编译 Charles;盲目冒进:机器学习的5个失败案例[N];计算机世界;2018年
3 本报驻波士顿记者 侯丽;深入挖掘机器学习潜力[N];中国社会科学报;2019年
4 王方 编译;菌自何方 机器学习早知道[N];中国科学报;2019年
5 Matt Asay 编译 Monkey King;为什么机器学习没有捷径可循?[N];计算机世界;2019年
6 本报记者 操秀英;当量子计算遇到机器学习会碰撞出什么火花?[N];科技日报;2019年
7 彭博企业数据业务全球负责人 Gerard Francis;金融数据质量决定机器学习时代的投资回报[N];计算机世界;2019年
8 Isaac Sacolick 编译 Charles;关于机器学习的5个要点[N];计算机世界;2019年
9 记者 张梦然;全新算法助机器学习抵抗干扰[N];科技日报;2019年
10 惠赞瑾;《科学向左,科幻向右》:机器学习即将成为现实[N];中国会计报;2019年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978