收藏本站
《中国科学院研究生院(上海生命科学研究院)》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于蛋白质序列和生物医学文献的蛋白质功能挖掘

俞晓晶  
【摘要】:运用计算手段对蛋白质功能进行分类预测是当前生物信息学的研究热点之一,本文针对包含蛋白质功能信息的两大载体:蛋白质序列和生物医学文献,运用机器学习和自然语言处理技术进行挖掘分析。 在蛋白质序列分析方面,采用了经典氨基酸组成、基于氨基酸组成的氨基酸序列物理化学组成与分布法和蛋白质功能域组成法三种不同的蛋白质序列描述方法。应用最近邻算法、支持向量机、极大似然估计以及期望最大化算法等机器学习算法,我们分别尝试研究蛋白质四级结构分类、DNA/RNA结合蛋白质预测以及蛋白质功能分类问题,获得了较满意的分类预测准确率。蛋白质序列分析的结果显示蛋白质功能域组成是蛋白质序列信息非常高效的描述符,表明功能域在蛋白质功能行使中发挥着重要作用。据此,我们在MEDLINE的摘要数据库中运用自然语言处理技术挖掘关于蛋白质功能域相互作用的信息,加上从其它实验室得到的数据,一共搜集到175条功能域与功能域相互作用的信息和355条功能域与其它生物分子相互作用的信息。在此基础上,我们整合了Pfam、Swiss-Prot、InterPro、GO、DIP、KEGG等其它数据库与功能域相关的信息,构建了蛋白质功能域相互作用数据库(Database of Domain Interactions and Bindings,DDIB)。用户可以通过地址http://www.ddib.org访问查询。
【学位授予单位】:中国科学院研究生院(上海生命科学研究院)
【学位级别】:博士
【学位授予年份】:2006
【分类号】:Q51;Q811.4

【相似文献】
中国期刊全文数据库 前10条
1 王正华;王秀鹤;王勇献;张振慧;;基于相互作用的蛋白质功能预测[J];激光生物学报;2007年04期
2 卢宏超;石秋艳;石宝晨;张治华;赵屹;唐素勤;熊磊;王强;陈润生;;基于蛋白质网络功能模块的蛋白质功能预测[J];生物化学与生物物理进展;2006年05期
3 孙景春,徐晋麟,李亦学,石铁流;大规模蛋白质相互作用数据的分析与应用[J];科学通报;2005年19期
4 王秀鹤;王正华;王勇献;张振慧;;基于分组重量编码的蛋白质功能预测[J];生物信息学;2007年01期
5 宋卓;张宁;阮吉寿;杨卓;张涛;;基于氨基酸序列预测蛋白质功能性点突变位点[J];生物物理学报;2007年02期
6 倪青山;王正志;黎刚果;孟祥林;;基于K近邻的蛋白质功能的预测方法[J];生物医学工程研究;2009年02期
7 曹建平,马义才,李亦学,石铁流;计算方法在蛋白质相互作用研究中的应用[J];生命科学;2005年01期
8 曾岚,徐晋麟,李亦学,石铁流;大规模蛋白质功能预测方法的进展[J];生命的化学;2005年01期
9 贺光;生物信息学在蛋白质研究中的应用[J];国外医学.遗传学分册;2002年03期
10 杨亮,宁瑛惠;基因组信息学简介[J];生物学教学;2000年09期
中国博士学位论文全文数据库 前3条
1 俞晓晶;基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D];中国科学院研究生院(上海生命科学研究院);2006年
2 李敏;蛋白质网络中复合物和功能模块挖掘算法研究[D];中南大学;2008年
3 张同亮;基于智能计算的蛋白质功能预测研究[D];东华大学;2008年
中国硕士学位论文全文数据库 前2条
1 王秀鹤;基于序列和相互作用的蛋白质功能预测[D];国防科学技术大学;2006年
2 刘昊;基于聚类算法和相互作用网络的蛋白质功能预测研究[D];湖南大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026