收藏本站
《湖南大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于序列特征的蛋白质功能类预测方法研究

李希  
【摘要】: 随着人类基因组计划(Human Genome Project, HGP)的实施,核酸、蛋白质的序列和结构数据呈指数增长,生命科学已实质性地步入到后基因组时代。序列信息不断累积的同时,大量参与重要生命活动的蛋白质功能却仍然未知。蛋白质序列数据和功能信息之间的差距,使得在全蛋白质组范围内确定蛋白质的功能成为后基因时代生物学研究的主要任务之一。随着序列信息的急剧增加,人们开始将更多的注意力放在如何从序列预测蛋白质功能的问题上。论文主要研究基于序列特征的蛋白质功能类预测,主要工作包括: 在对蛋白质序列的表征方法和分类方法进行较为详细的综述之后,提出了一种氨基酸序列的全局编码(Global Encoding, GE)方法来表征蛋白质序列,并采用最近邻分类算法预测蛋白质的功能类。通过对酵母蛋白质的1818条序列进行功能分类预测,验证了这种方法的有效性。特别是当蛋白质相互作用信息有限,仅采用序列信息的情况下,它能有效地提取蛋白质序列中蕴含的功能信息,达到蛋白质功能类预测的目的。 另外,还根据蛋白质的组成、物化属性、序列局部信息,以及氨基酸的位置信息提出了一种新的蛋白质序列表征方法-加权分段伪氨基酸组成位置向量(W-SPsAA-MV)。该向量的维度比氨基酸序列全局编码的维度要低,并且通过最近邻分类算法得到的预测结果也有所改进。针对蛋白质的功能类别可能有一种或多种的情况,采用协方差判别式分类器对其进行了预测评估,实验结果表明,该分类器能较好的应用于蛋白质的功能类预测。
【关键词】:蛋白质序列 蛋白质功能类预测 全局编码 加权分段伪氨基酸组成位置向量 最近邻分类算法 协方差判别式分类器
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:Q51
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 插图索引10-11
  • 附表索引11-12
  • 第1章 绪论12-19
  • 1.1 研究背景及意义12-14
  • 1.2 国内外研究现状14-16
  • 1.3 本文研究的主要内容16-17
  • 1.4 论文的结构17-19
  • 第2章 蛋白质的功能类预测19-35
  • 2.1 蛋白质功能预测的若干基础知识19-22
  • 2.1.1 蛋白质的组成19-20
  • 2.1.2 蛋白质的物化属性20-21
  • 2.1.3 蛋白质的生物功能21-22
  • 2.2 蛋白质序列的表征方法22-29
  • 2.2.1 氨基酸组成与双残基组成23
  • 2.2.2 氨基酸的物化性质组成、转换与分布法23-24
  • 2.2.3 蛋白质的分组重量编码24-26
  • 2.2.4 伪氨基酸组成法26-29
  • 2.3 分类预测算法29-32
  • 2.3.1 最近邻分类算法29-30
  • 2.3.2 支持向量机30-32
  • 2.4 蛋白质功能预测实验数据来源及分类系统评估方法32-34
  • 2.4.1 实验数据来源32-33
  • 2.4.2 分类系统评估方法33-34
  • 2.5 小结34-35
  • 第3章 基于序列全局编码的蛋白质功能类预测35-41
  • 3.1 引言35
  • 3.2 原理与方法35-39
  • 3.2.1 蛋白质序列的全局编码35-38
  • 3.2.2 最近邻分类器38-39
  • 3.3 结果与讨论39-40
  • 3.3.1 实验数据来源39
  • 3.3.2 蛋白质的功能类预测及结果分析39-40
  • 3.4 小结40-41
  • 第4章 基于加权分段伪氨基酸组成位置向量的蛋白质功能类预测41-54
  • 4.1 引言41
  • 4.2 原理与方法41-47
  • 4.2.1 加权分段伪氨基酸组成位置向量41-45
  • 4.2.2 最近邻分类算法45
  • 4.2.3 协方差判别式分类器45-47
  • 4.3 结果与讨论47-52
  • 4.4 小结52-54
  • 结论54-56
  • 参考文献56-62
  • 致谢62-63
  • 附录A 攻读学位期间所发表的学术论文及所参加项目63

【引证文献】
中国硕士学位论文全文数据库 前1条
1 何凤云;耐高温碱性蛋白酶生产菌20101的选育及酶学性质研究[D];吉林农业大学;2012年
【参考文献】
中国期刊全文数据库 前6条
1 黄京飞,Tom L.Blundell;蛋白质序列和结构的保守性与其功能的关系[J];动物学研究;1999年01期
2 王正华;王秀鹤;王勇献;张振慧;;基于相互作用的蛋白质功能预测[J];激光生物学报;2007年04期
3 张春霆;生物信息学的现状与展望[J];世界科技研究与发展;2000年06期
4 蒋英芝;贺连华;刘建军;;蛋白质功能研究方法及技术[J];生物技术通报;2009年09期
5 王秀鹤;王正华;王勇献;张振慧;;基于分组重量编码的蛋白质功能预测[J];生物信息学;2007年01期
6 张猛;于军;;人类基因组计划与人类健康[J];医学研究杂志;2007年05期
中国硕士学位论文全文数据库 前2条
1 王秀鹤;基于序列和相互作用的蛋白质功能预测[D];国防科学技术大学;2006年
2 马雅楠;改进的系统发育谱方法在蛋白质功能预测中的应用[D];东北师范大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 黄啸;;生物信息学在蛋白质组学上的应用[J];安徽农业科学;2006年23期
2 王勇;陈克平;姚勤;;系统发生分析软件PAUP和TreePuzzle使用方法介绍[J];安徽农业科学;2008年02期
3 王勇;陈克平;姚勤;;系统发生分析程序MrBayes 3.1使用方法介绍[J];安徽农业科学;2009年33期
4 王雯雯;武栓虎;;基于DNA双链特征的启动子预测方法[J];北京交通大学学报;2009年06期
5 秦洋;王立宏;武栓虎;宋宜斌;;基于拉普拉斯矩阵的DNA序列集相似性分析[J];北京交通大学学报;2009年06期
6 刘军梅;李昊;崔东清;叶梅霞;张志毅;安新民;;毛白杨labA-like1基因的克隆与表达特性及其表达载体的构建[J];北京林业大学学报;2011年04期
7 石鸥燕;杨文万;;生物信息数据库及其利用[J];包头医学院学报;2006年03期
8 向浏欣;谭军;;浅谈系统发生树构建方法[J];才智;2009年20期
9 向恒;张瑞芝;潘国庆;周泽扬;;对蚕学专业引入基因组与生物信息学课程的思考[J];蚕学通讯;2011年04期
10 潘宇;王坤波;徐仲溪;徐辉;何志丹;;茶叶多酚氧化酶的序列分析与结构预测[J];茶叶科学;2008年03期
中国重要会议论文全文数据库 前7条
1 胡扬;桂卫华;;人工代谢技术在医药领域中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
2 姜春林;杜维滨;李江波;;药物分子设计技术领域的文献计量可视化分析[A];科学学理论与科学计量学探索——全国科学技术学暨科学学理论与学科建设2008年联合年会论文集[C];2008年
3 潘宇;王坤波;徐仲溪;徐辉;何志丹;;茶叶多酚氧化酶的序列分析与结构预测[A];湖南省茶叶学会2007年学术年会论文集[C];2007年
4 刘晓辉;李晓琴;任文科;徐海松;;α类蛋白折叠类型的氨基酸取代矩阵研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
5 杨长平;;生物信息学在畜禽基因组研究中的应用[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
6 李凤敏;李前忠;张俊萍;;基于离散增量和协变判别式识别小鼠蛋白质亚细胞定位[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
7 吴泽月;陈月辉;;基于二叉树和人工神经网络的蛋白质亚细胞定位预测[A];山东计算机学会2013学术年会论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 李惠华;龙眼体胚发生过程中激素代谢和信号转导相关基因的克隆与表达[D];福建农林大学;2010年
2 徐兆华;基因芯片数据统合分析方法的若干拓展[D];浙江大学;2010年
3 陈欣;蛋白质在不同界面的识别、吸附及稳定性研究[D];浙江大学;2009年
4 顾全;基于集成智能的膜蛋白受体结构与功能研究[D];东华大学;2010年
5 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
6 董浩;RNA二级结构预测方法研究[D];吉林大学;2011年
7 李晓薇;大豆两个MYB转录因子基因的克隆及其功能分析[D];吉林大学;2011年
8 张胜利;蛋白质与RNA中的若干问题研究[D];大连理工大学;2011年
9 刘晨光;氧化还原电位调控的高浓度乙醇发酵及其机理研究[D];大连理工大学;2011年
10 刘念;三种蝗虫线粒体基因组测序与直翅目比较线粒体基因组学分析[D];陕西师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
2 吕俊杰;真核基因剪接位点识别算法研究[D];哈尔滨工程大学;2010年
3 史舵;基于主成分分析方法的蛋白质亚细胞定位[D];大连理工大学;2010年
4 高珍;浒苔生理生态特性和转录组研究[D];甘肃农业大学;2010年
5 战晓文;基于完全基因组且无序列比对的用于亲缘分析的严格距离度量[D];湘潭大学;2010年
6 王若飞;基于机器学习的蛋白质折叠预测算法研究[D];湘潭大学;2010年
7 卓立;中国滨藜亚科的地理分布与分子系统学研究[D];新疆农业大学;2010年
8 赵丹;基于SVM分类机的DNA序列分类方法[D];南昌大学;2010年
9 张天红;网络钓鱼预警系统设计与分析[D];电子科技大学;2010年
10 林妙春;贪食迈阿密虫的生物学特性研究[D];福建师范大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 黄爱玲;周美华;;玉米秸秆水解的酶法与稀酸法比较[J];东华大学学报(自然科学版);2005年05期
2 杨永明,卢德勋,卢媛;微生物发酵秸秆饲料的研究现状及展望[J];饲料工业;2002年02期
3 胡学智;王俊;;蛋白酶生产和应用的进展[J];工业微生物;2008年04期
4 格毕,白瑞苓;为什么硫酸铵具有特别显著的盐析作用?[J];化学教学;1997年08期
5 何北海;林鹿;孙润仓;孙勇;;木质纤维素化学水解产生可发酵糖研究[J];化学进展;2007年Z2期
6 李树文;陆秀华;尚海利;;碱性蛋白酶产生菌的筛选[J];莱阳农学院学报;2006年01期
7 韩鲁佳,闫巧娟,刘向阳,胡金有;中国农作物秸秆资源及其利用现状[J];农业工程学报;2002年03期
8 陶斌;范贵堂;;二十一世纪初我国皮革工业状况[J];皮革与化工;2008年01期
9 刘登勇;食品添加剂在肉类嫩化中的应用[J];肉类工业;2003年03期
10 张雪梅;蒋雨;;食品中蛋白质的功能(二) 蛋白质结构与食品功能性质的关系研究[J];肉类研究;2009年05期
中国硕士学位论文全文数据库 前3条
1 田宇;泰乐菌素高产菌株的选育及其培养条件的优化[D];华中农业大学;2006年
2 刘佩;纺织用果胶酶制剂的优化及其应用研究[D];青岛大学;2008年
3 王超;微波辐射对洗涤剂用酶的作用[D];江南大学;2009年
【二级参考文献】
中国期刊全文数据库 前6条
1 谭璐;姜璐;;系统生物学与生物网络研究[J];复杂系统与复杂性科学;2005年04期
2 冯永强,阎小君,苏成芝;基因芯片技术[J];国外医学(分子生物学分册);2000年01期
3 俞晓晶,林建成,石铁流,李亦学;一种基于结构域的蛋白质功能分类预测新方法[J];科学通报;2004年20期
4 解涛,梁卫平,丁达夫;后基因组时代的基因组功能注释[J];生物化学与生物物理进展;2000年02期
5 张春霆;生物信息学的现状与展望[J];世界科技研究与发展;2000年06期
6 陈作舟,朱晟,薛成海,陈良标;ortholog——概念、生物信息预测方法和数据库[J];生物物理学报;2004年02期
中国博士学位论文全文数据库 前1条
1 王勇献;蛋白质二级结构预测的模型与方法研究[D];国防科学技术大学;2004年
中国硕士学位论文全文数据库 前1条
1 赵晶;蛋白质结构与功能研究方法探讨[D];大连理工大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 张玲,林澄涛,王恒;基因组范围的蛋白质功能研究方法初探[J];生物化学与生物物理进展;2001年05期
2 刘秀艳,滕胜;应用计算机识别蛋白质功能[J];生命的化学;2000年03期
3 张成林;李建远;;蛋白质相互作用的研究方法[J];中外医学研究;2011年04期
4 王大成;;蛋白质的三维结构研究[J];生物化学与生物物理进展;1980年05期
5 ;增强食欲的蛋白质[J];生命世界;2006年05期
6 陈丽娜;王倩;尚玉奎;张良才;孙钊;何伟明;赵研;李琬;王宏;何月涵;李霞;;人类蛋白质结构互作网络——结构域对网络拓扑与蛋白质功能的影响[J];生物化学与生物物理进展;2010年05期
7 陶站华,王淑静,刘兴汉;蛋白质转导技术及其应用[J];医学分子生物学杂志;2005年02期
8 高飞雪;杨俊林;;我国科学家在蛋白质功能设计领域取得重要进展[J];中国科学基金;2007年05期
9 杨运春;;“生命活动的主要承担者——蛋白质”的教学设计[J];生物学通报;2008年07期
10 王祥余;朴永哲;翟明昌;王晓丹;程贺;赵长新;;酿酒酵母FFC2146胞内蛋白及胞外蛋白双向电泳条件优化及图谱建立[J];微生物学通报;2011年02期
中国重要会议论文全文数据库 前10条
1 刘银坤;;疾病蛋白质组学研究重点和临床应用展望[A];中华医学会第七次全国检验医学学术会议资料汇编[C];2008年
2 高飞;;泛素样蛋白NEDD8对乳腺癌相关蛋白3(BCA3)的修饰及BCA3对NFκB活性的抑制[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
3 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
4 林东海;;用异核多维NMR技术测定蛋白质的溶液结构[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
5 徐加豹;蔡浩洋;张义正;李校;;基于基因网络预测哺乳动物线粒体蛋白质的功能[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
6 张小伟 ;张群业 ;鲁静 ;黄秋花;;全反式维甲酸诱导NB4细胞分化蛋白组中蛋白修饰及Isoforms变化的初步研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
7 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
8 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
9 刘克良;梁远军;;肽类药物研究进展[A];2006第六届中国药学会学术年会大会报告集[C];2006年
10 许越;;非损伤型扫描离子选择电极技术及其在基因组研究后期的应用[A];生物膜与重大疾病学术研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 记者 吴仲国;日首次公开招募研究人员[N];科技日报;2001年
2 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
3 采访记者 姜洪良;弱碱性活蛋白 创造蛋白质功能的升级[N];中国食品质量报;2005年
4 记者 刘恕;我国启动四项重大科学研究计划[N];科技日报;2006年
5 记者 顾钢;科学家发现干细胞蛋白质调控新机制[N];科技日报;2007年
6 刘云涛;北大蛋白质功能设计研究获新进展[N];中国医药报;2007年
7 记者:周清春;蛋白质研究:触摸生命的本质[N];科技日报;2006年
8 华琳 王治强;我校三项“973”项目通过科技部验收[N];新清华;2005年
9 梁远军 刘克良;肽类药物研究: 无限风光在险峰[N];中国医药报;2007年
10 白京丽;我国应重视对糖的研究[N];中国医药报;2000年
中国博士学位论文全文数据库 前10条
1 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
2 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年
3 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年
4 董少忠;一个HSV-1刺激相关基因的克隆及其功能的初步分析[D];中国协和医科大学;2003年
5 李健峰;与HSV-1感染相关的细胞立即早期基因产物HTRP在细胞辅抑制因子复合物中功能的分析[D];中国协和医科大学;2004年
6 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年
7 孙承磊;基于数据挖掘技术的蛋白质功能预测研究[D];上海大学;2013年
8 段谟杰;蛋白质结构预测与结构比对方法的研究[D];华中科技大学;2009年
9 徐超;结构基因组数据库构建及蛋白质主链构象的计算分析[D];中国科学技术大学;2008年
10 李林辉;小立碗藓冷胁迫下表达序列标签分析及其相关基因Cor166的功能初探[D];首都师范大学;2005年
中国硕士学位论文全文数据库 前10条
1 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
2 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年
3 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
4 贾元丰;基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测[D];山西大学;2013年
5 蔡娟;基于蛋白质相互作用网络及聚类算法的蛋白质功能预测方法研究[D];中南大学;2012年
6 胡伟凤;基于不确定网络的蛋白质功能模块挖掘算法研究[D];湖南大学;2013年
7 贾翠翠;基于随机游走的蛋白质功能预测算法设计与实现[D];黑龙江大学;2014年
8 刘钦锋;蛋白质序列编码与功能预测[D];湖南大学;2011年
9 黄淑云;基于序列的蛋白质功能预测研究[D];南昌大学;2012年
10 呙中美;基于融合特征的蛋白质亚细胞定位预测[D];湖南大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026