收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质—核酸界面丙氨酸突变效应数据库与热点残基研究

刘玲  
【摘要】:蛋白质和核酸的相互作用在生物体的众多生命活动中发挥着非常重要的作用,例如基因的转录,翻译,DNA修复和DNA组装等过程。了解相互作用中氨基酸的替换对蛋白质-核酸结合亲和力的影响,可能有利于阐明蛋白质-核酸识别的分子机制;也有助于寻找一些涉及到蛋白质-核酸相互作用紊乱而产生的复杂疾病的解决方法。然而时至今日,仍然没有一个全面的最新的包含蛋白质-核酸界面丙氨酸突变定量结合数据的数据库可以公开访问。基于此,我们建立了一个新的用于研究蛋白质-核酸相互作用丙氨酸突变效应的数据库(dbAMEPNI)。dbAMEPNI是一个基于文献的,由人工管理的数据库。数据库包含一个核心数据集(Core set),这个数据集中包含了 577个由实验测定的蛋白质-核酸界面丙氨酸突变的结合亲和力数据,它们包含了很多重要的组分,如解离常数(Kd),以及吉布斯自由能的变化(AAG),实验条件和蛋白质界面中突变残基的结构参数。另外,数据库还包含了一个扩展数据集(Extended set),这一数据集仅包含282个单丙氨酸突变的热力学效应的定性(或者描述性)数据。数据库公开访问网址为:http://zhulab.ahu.edu.cn/dbAMEPNI/。基于此数据集,我们进一步发展了一种基于知识的蛋白质-核酸界面热点残基预测方法。热点残基是蛋白质-核酸相互作用界面残基中的一小部分残基,他们贡献了蛋白质-核酸结合中绝大部分的亲和性。蛋白质-蛋白质界面热点残基已经被广泛的研究,与之相比,对蛋白质-核酸相互作用界面热点残基的研究仍然很少,其中一个很重要的原因是蛋白质-核酸相互作用的突变数据不像蛋白质-蛋白质界面那么多。在本文的研究中,我们从我们自己构建的dbAMEPNI数据库中获取503个丙氨酸突变数据,这些数据都有热力学记录。然后使用PISCES去除冗余后,得到了 358个蛋白质-核酸界面的丙氨酸突变数据。其中299个数据被用来作为训练数据集训练我们的模型,剩下59个则被用作独立测试集来评价模型的泛化能力。为了构建我们的模型,我们生成了七大类共计97个不同的结构特征,并使用决策树和顺序向前特征选择来选择最优的特征子集。最后利用支持向量机(SVM)构建了一个基于10个特征的模型。这些特征中包含了两个新提出的特征,分别为△SASsa1/2和esp3。前者是残基侧链埋藏的绝对溶剂可及表面积的平方根,后者是目标残基周围小片的静电势。在训练集的交叉验证中,我们模型的敏感度,精确度,准确度和F1 score分别为0.640,0.764,0.840和0.696,而另一种目前已有的用于预测蛋白质-核酸相互作用热力学效应的mCSM-NA模型,它的敏感度,精确度,准确度和F1 score分别为0.419 0.350 0.609和0.381。除此之外,该模型在独立测试集上进行进一步验证,独立测试集中的59个数据中有3个是热点残基,另外的56个为非热点残基。我们的模型在独立测试集中给出的敏感度,精确度,准确度和F1 score分别为0.667,0.400,0.932和0.500,相比较mCSM-NA的1.00,0.100,0.542和0.182而言,我们的模型在预测效果上有一定的优势。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李炜;;机器学习概述[J];科技视界;2017年12期
2 朱辉;;机器学习在企业级场景中的实践与探讨[J];中国建设信息化;2018年03期
3 彭传意;;机器学习——我们该如何与机器竞争[J];数字通信世界;2018年01期
4 陈轶翔;埃里克·布伦乔尔森;汤姆·米切尔;;机器学习的能力范围及其对劳动力的影响[J];世界科学;2018年04期
5 赵长林;;机器学习即服务[J];网络安全和信息化;2017年10期
6 ;机器学习作用于信息安全的五大顶级案例[J];网络安全和信息化;2018年01期
7 吴承杨;;2018年来说说机器学习[J];软件和集成电路;2018年05期
8 徐林;;基于机器学习思想的非线性方程组求解[J];黑龙江工程学院学报;2016年06期
9 ;《软件学报》复杂环境下的机器学习研究专刊征文通知[J];软件学报;2017年01期
10 ;机器学习如何助力安全[J];计算机与网络;2017年06期
11 夏天;;机器学习及其算法与应用研究[J];电脑知识与技术;2017年15期
12 Nick Ni;Adam Taylor;;嵌入式视觉应用中的机器学习[J];单片机与嵌入式系统应用;2017年08期
13 ;天津科技大学参与承办第十六届中国机器学习会议[J];中国轻工教育;2017年04期
14 沈荣;张保文;;机器学习学习方式及其算法探讨[J];电脑知识与技术;2017年23期
15 ;2016机器学习国际会议(英文)[J];智能系统学报;2016年01期
16 David W.Cearley;Mike J.Walker;吕俊宽;;高级机器学习支持全新数字现实[J];软件和集成电路;2016年04期
17 邱梁东;;机器学习与游戏的思考[J];数码世界;2018年03期
18 周志华;;《机器学习》[J];航空港;2018年02期
19 张泽玲;;机器学习的奥秘[J];课堂内外(科学Fans);2017年01期
20 理查德·沃特斯;;如何让人工智能造福人类?[J];中国经济信息;2017年05期
中国重要会议论文全文数据库 前10条
1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
2 张长水;;大数据机器学习[A];2015年中国自动化大会摘要集[C];2015年
3 何琳;侯汉清;;基于标引经验和机器学习相结合的多层自动分类[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
4 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
5 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
6 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
7 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 陈翠云;刘志宇;宫月;;基于机器学习的网络入侵检测模型及方法研究[A];第六届全国网络安全等级保护技术大会论文集[C];2017年
9 朱焕;胡祥杰;;2016机器学习三大趋势:算法经济将引导人工智能走向何方?[A];《科学与现代化》2017年第1期(总第070期)[C];2017年
10 刘铸樘;;互联网+背景下机器学习法在体育中的应用[A];2016年第十二届全国体育信息科技学术大会论文摘要汇编(数字体育研究)[C];2016年
中国博士学位论文全文数据库 前10条
1 张庆庆;基于机器学习的文本情感分类研究[D];西北工业大学;2016年
2 鲁路;基于机器学习优化分子对接筛选肾衰营养胶囊有效成分[D];南方医科大学;2017年
3 王泉德;机器学习及其在多Agent对策学习中的应用研究[D];武汉大学;2005年
4 翁时锋;基于机器学习的几种医学数据处理方法研究[D];清华大学;2005年
5 范玉刚;基于Kernel的机器学习在建模与分类问题的应用研究[D];浙江大学;2006年
6 蒋刚;核机器学习方法若干问题研究[D];西南交通大学;2006年
7 李智;机器学习方法及其在基金项目评审中的应用研究[D];天津大学;2004年
8 张义荣;基于机器学习的入侵检测技术研究[D];国防科学技术大学;2005年
9 刘章林;基于机器学习的编译优化适应性研究[D];中国科学院研究生院(计算技术研究所);2006年
10 何清;机器学习与文本挖掘若干算法研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前10条
1 王爽;基于机器学习的花卉识别算法的研究与实现[D];电子科技大学;2018年
2 任高山;基于微信公众平台的文本情感分析研究[D];南昌航空大学;2018年
3 刘玲;蛋白质—核酸界面丙氨酸突变效应数据库与热点残基研究[D];安徽大学;2018年
4 张英凯;基于机器学习的重症监护病患死亡率预测[D];电子科技大学;2018年
5 刘鑫;机器学习研究及其在生存分析中的应用[D];电子科技大学;2018年
6 唐林;天数机器学习一体机系统的设计与实现[D];南京大学;2018年
7 张磊;基于机器学习的情感分析方法研究[D];电子科技大学;2018年
8 张为金;基于机器学习的电力异常数据检测[D];电子科技大学;2018年
9 颜欢;基于机器学习的AGV货物分拣系统研究与设计[D];武汉纺织大学;2018年
10 Lavocier K.Smith,Jr.;[D];湖南大学;2017年
中国重要报纸全文数据库 前10条
1 360 IoT研究院院长 李康;从机器学习到机器创造[N];中国信息化周报;2017年
2 谢静;机器学习帮助用户释放数据价值[N];人民邮电;2018年
3 Mary Branscombe 编译 范范;关于机器学习的9大误区[N];计算机世界;2018年
4 张盖伦;机器学习界所抵制的,是旧的知识分享方式[N];科技日报;2018年
5 外语教学与研究出版社基础教育分社综合产品部编辑部副主任 张世钦;机器学习赋能编辑出版[N];中国出版传媒商报;2018年
6 本报记者 杨博;苹果呼吁放宽自动驾驶测试限制[N];中国证券报;2016年
7 ;大数据未来十大发展趋势[N];中国信息化周报;2016年
8 卫人;中国人工智能历史元年,一切才刚刚开始[N];中国经济导报;2016年
9 ;机器学习是否等同于人工智能[N];中国信息化周报;2016年
10 本报记者 何晓亮;工具开放:开启人工智能“全民时代”[N];科技日报;2016年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978