收藏本站
《国防科学技术大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于序列和相互作用的蛋白质功能预测

王秀鹤  
【摘要】: 蛋白质组学研究是后基因时代生物信息学中最重大的研究课题之一,蛋白质功能预测是蛋白质组学富有挑战性的问题之一。它的研究不仅可以直接阐明生命体在生理或病理条件下的变化机制,而且对生物制药、农业生物科技等应用领域同样具有直接的指导作用。 本文在深入分析现有蛋白质功能预测方法的基础上,对蛋白质功能预测问题进行了深入研究,提出了两种新的蛋白质功能预测模型,并进行了相应的实验分析,取得了较好的结果。论文主要工作包括: (1)总结了现有蛋白质功能预测技术。本文从蛋白质序列、结构与相互作用入手,系统分析了蛋白质功能预测研究现状,归纳总结出了当前蛋白质功能预测所面临的挑战和困难,据此给出了本学位论文的研究内容。 (2)提出并实现了基于相互作用的蛋白质功能预测模型。蛋白质是通过与其他蛋白质直接或间接的相互作用执行其功能的。据此本文提出了一种结合蛋白质相互作用与“小世界网络”特性的蛋白质功能预测新模型。该模型将蛋白质相互作用网络看成是一个小世界网络,利用小世界网络的相关特性提出新的预测算法,对蛋白质功能进行预测。该模型有效解决了蛋白质伙伴数目较小时预测准确率不高的问题,当伙伴蛋白质数目小于4时,预测准确率比相同条件下的GO模型提高了3~4个百分点。最终本文提出了结合SWN-BA方法与GO方法的综合模型。实验结果表明,综合模型能够有效应用于蛋白质功能预测研究。 (3)提出并实现了基于分组重量编码的蛋白质功能预测模型。基于相互作用的蛋白质功能预测模型无法适用于无相互作用信息的蛋白质,因此我们提出了一种新的仅基于蛋白质序列信息的功能预测模型。蛋白质序列的分组重量编码方法,利用物理学中“粗粒化”的思想,结合了一定的氨基酸特性。该方法将蛋白质序列约化成一组向量,能从蛋白质序列中提取较多的功能信息。将分组重量编码与最近邻居算法相结合应用于蛋白质功能预测研究,实验结果表明该模型能较好的应用于无相互作用的蛋白质的功能预测。
【关键词】:蛋白质功能预测 蛋白质-蛋白质相互作用 分组重量编码 小世界网络
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:Q51
【目录】:
  • 摘要8-9
  • ABSTRACT9-10
  • 第一章 绪论10-20
  • 1.1 研究背景10-17
  • 1.1.1 后基因时代的生物信息学10-12
  • 1.1.2 国内外生物信息学的研究现状12-16
  • 1.1.3 生物信息学研究的热点问题16-17
  • 1.2 论文的主要工作与创新17-18
  • 1.3 论文结构18-20
  • 第二章 蛋白质功能预测20-32
  • 2.1 蛋白质功能预测的目的及意义20-21
  • 2.2 蛋白质功能预测的研究现状21-25
  • 2.2.1 基于序列的蛋白质功能预测21-22
  • 2.2.2 基于相互作用的蛋白质功能预测22-23
  • 2.2.3 基于结构域的蛋白质功能预测23-25
  • 2.3 蛋白质功能预测中常用的数据集与评价方法25-29
  • 2.3.1 蛋白质数据库26-27
  • 2.3.2 模型检验方法27-28
  • 2.3.3 性能评估指标28-29
  • 2.4 蛋白质功能预测的困难与挑战29-30
  • 2.5 本文方案30-31
  • 2.6 本章小结31-32
  • 第三章 基于相互作用网络的功能预测32-47
  • 3.1 蛋白质相互作用网络32-36
  • 3.1.1 系统生物学32-34
  • 3.1.2 生物网络研究34-35
  • 3.1.3 蛋白质相互作用网络35-36
  • 3.2 小世界网络概论36-38
  • 3.2.1 小世界网络的产生36-37
  • 3.2.2 小世界网络的特性37-38
  • 3.3 基于小世界网络特征的蛋白质功能预测建模38-41
  • 3.4 SWN-BA 方法的实验结果与分析41-44
  • 3.4.1 实验材料和数据41-42
  • 3.4.2 实验结果与分析42-44
  • 3.5 结合SWN-BA 方法与GO 方法的综合预测模型44-46
  • 3.6 本章小结46-47
  • 第四章 基于分组重量编码的蛋白质功能预测47-59
  • 4.1 蛋白质序列的分组重量编码47-52
  • 4.1.1 蛋白质的组成47-48
  • 4.1.2 蛋白质的一级结构和物化性质48-50
  • 4.1.3 蛋白质序列的分组重量编码50-52
  • 4.2 最近邻居法52-54
  • 4.3 基于分组重量编码的蛋白质功能预测54-58
  • 4.3.1 基于分组重量编码的蛋白质功能预测建模54-55
  • 4.3.2 数据集合与功能分类55
  • 4.3.3 分组重量编码的参数选择55-56
  • 4.3.4 实验结果与分析56-58
  • 4.4 本章小结58-59
  • 第五章 研究工作总结与展望59-61
  • 5.1 结论59-60
  • 5.2 进一步研究的建议60-61
  • 致谢61-63
  • 攻读硕士学位期间发表的论文63-64
  • 攻读硕士学位期间参加的科研工作64-65
  • 参考文献65-68

【引证文献】
中国博士学位论文全文数据库 前1条
1 杜秀全;基于智能计算的蛋白质相互作用预测方法研究[D];安徽大学;2010年
中国硕士学位论文全文数据库 前2条
1 李慧;蛋白质功能预测的层次化分类方法研究[D];吉林大学;2010年
2 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
【参考文献】
中国期刊全文数据库 前3条
1 谭璐;姜璐;;系统生物学与生物网络研究[J];复杂系统与复杂性科学;2005年04期
2 俞晓晶,林建成,石铁流,李亦学;一种基于结构域的蛋白质功能分类预测新方法[J];科学通报;2004年20期
3 张春霆;生物信息学的现状与展望[J];世界科技研究与发展;2000年06期
中国博士学位论文全文数据库 前1条
1 王勇献;蛋白质二级结构预测的模型与方法研究[D];国防科学技术大学;2004年
中国硕士学位论文全文数据库 前1条
1 赵晶;蛋白质结构与功能研究方法探讨[D];大连理工大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 郭苗莉,朱江波,陈蓉芳,张天宝;应用基因表达谱芯片研究MNNG诱致小鼠胚胎畸形肢体基因表达的变化[J];癌变.畸变.突变;2005年02期
2 王朝霞;生物信息学:一门前沿交叉学科[J];安徽教育学院学报;2002年06期
3 黄啸;;生物信息学在蛋白质组学上的应用[J];安徽农业科学;2006年23期
4 张树林;何德;朱高浦;刘杰;莫鹏巧;;生物信息学在农业上的应用[J];安徽农业科学;2007年22期
5 吉冬梅;;酵母基因表达调控关系的构建及其统计特性分析[J];安徽农业科学;2009年10期
6 李显勇;李燕雏;尹卫华;张凌燕;;“仿生内控”治疗晚期癌症的临床应用报告[J];癌症进展;2008年03期
7 鲍智娟;;人类基因组计划的内容与研究方法[J];白城师范学院学报;2006年04期
8 孙德利,舒琦瑾;基因表达谱——中医药功能基因组学研究的思考[J];浙江中医学院学报;2002年01期
9 冯梦蝶;张林;柴惠;;生物基因与蛋白质序列比对算法的图形硬件加速研究[J];浙江中医药大学学报;2012年04期
10 孟大志;仲国强;王丽娜;;DNA芯片组技术及其在解决NP问题中的应用[J];北京工业大学学报;2009年05期
中国重要会议论文全文数据库 前6条
1 庄绪静;曹雅忠;李克斌;尹姣;;同源建模和分子对接方法的应用与发展[A];植保科技创新与病虫防控专业化——中国植物保护学会2011年学术年会论文集[C];2011年
2 栾德琴;常国斌;陈国宏;;隐性白鸡不同时期肌肉组织生长相关基因的表达谱分析[A];安全优质的家禽生产——第十五次全国家禽学术讨论会论文集[C];2011年
3 姜春林;杜维滨;李江波;;药物分子设计技术领域的文献计量可视化分析[A];科学学理论与科学计量学探索——全国科学技术学暨科学学理论与学科建设2008年联合年会论文集[C];2008年
4 杨长平;;生物信息学在畜禽基因组研究中的应用[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
5 余杰;;中国蕈菌产品研究[A];首届中国蕈菌与健康高峰论坛论文集[C];2010年
6 周延清;张喻;张永华;陈艳梅;;植物基因启动子的克隆研究[A];遗传学进步促进粮食安全与人口健康高峰论坛论文集[C];2012年
中国博士学位论文全文数据库 前10条
1 贺厚光;双调控溶瘤腺病毒携带超抗原SEA基因治疗前列腺癌基础研究[D];苏州大学;2010年
2 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年
3 郭新军;拟黑多刺蚁肌细胞增强因子2与肌钙蛋白Ⅰ亚基基因的克隆及其在发育中的表达研究[D];陕西师范大学;2010年
4 陈欣;蛋白质在不同界面的识别、吸附及稳定性研究[D];浙江大学;2009年
5 顾全;基于集成智能的膜蛋白受体结构与功能研究[D];东华大学;2010年
6 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年
7 周晖;自由搜索算法及其在传感器网络中的应用[D];东华大学;2010年
8 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
9 赵斌;生物数学的起源与形成[D];西北大学;2011年
10 董浩;RNA二级结构预测方法研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 李智;梨抗黑星病类似基因Hcrp和启动子克隆与类受体蛋白分析[D];华中农业大学;2010年
2 徐杰;生物信息学在家蚕中用应用及Ras相关CTP结合蛋白C(BmRGPC的表达研究)[D];浙江理工大学;2010年
3 郑碧;家蚕小热休克蛋白22.6的克隆表达与功能初步分析[D];浙江理工大学;2010年
4 庄文华;家蚕ras oncogene (Bras2)的表达、纯化以及特性分析[D];浙江理工大学;2010年
5 马良;家蚕BmIBP基因的原核表达及其亚细胞定位研究[D];浙江理工大学;2010年
6 李婷婷;家蚕BmNADHb5的表达分析及其亚细胞定位[D];浙江理工大学;2010年
7 刘靓珏;家蚕RPA43相关基因(BmRPA43 N)的克隆表达及定位分析[D];浙江理工大学;2010年
8 潘海涛;小麦EST-SSR标记的开发和苗期养分吸收QTL定位[D];山东农业大学;2009年
9 史舵;基于主成分分析方法的蛋白质亚细胞定位[D];大连理工大学;2010年
10 高珍;浒苔生理生态特性和转录组研究[D];甘肃农业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 黄京飞,Tom L.Blundell;蛋白质序列和结构的保守性与其功能的关系[J];动物学研究;1999年01期
2 樊玮;粒子群优化方法及其实现[J];航空计算技术;2004年03期
3 周鹏;田菲菲;李波;吴世容;李志良;;一种基于遗传算法的肽/蛋白质结合模式虚拟筛选建模技术[J];化学学报;2006年07期
4 李舟军;陈义明;刘军万;陈火旺;;蛋白质相互作用研究中的计算方法综述[J];计算机研究与发展;2008年12期
5 王正华;王秀鹤;王勇献;张振慧;;基于相互作用的蛋白质功能预测[J];激光生物学报;2007年04期
6 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期
7 高洪元;刁鸣;王冰;;基于免疫粒子群算法的多用户检测技术研究[J];计算机工程与应用;2006年35期
8 尹燕斌,罗静初,姜颖;G蛋白偶联受体及其生物信息学研究[J];科学通报;2003年04期
9 陈光英,张千里,李星;特征选择和SVM训练模型的联合优化[J];清华大学学报(自然科学版);2004年01期
10 张铃,张钹,殷海风;多层前向网络的交叉覆盖设计算法[J];软件学报;1999年07期
中国博士学位论文全文数据库 前10条
1 张丽平;粒子群优化算法的理论及实践[D];浙江大学;2005年
2 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年
3 李伟红;基于支持向量机的人脸特征选择及识别研究[D];重庆大学;2006年
4 王兵;蛋白质相互作用及其位点的预测方法研究[D];中国科学技术大学;2006年
5 张振慧;蛋白质分类问题的特征提取算法研究[D];国防科学技术大学;2006年
6 王燕;机器学习在蛋白质结构和功能预测中的应用研究[D];华中科技大学;2006年
7 陈鹏;蛋白质残基间的相互作用分析与预测[D];中国科学技术大学;2007年
8 李明辉;基于机器学习的蛋白质二级结构和相互作用预测[D];哈尔滨工业大学;2007年
9 谢江;蛋白质相互作用网络的数值研究[D];上海大学;2008年
10 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 曹建平;生物信息学方法研究蛋白质相互作用[D];电子科技大学;2005年
2 邵壮超;基于多分类器组合的蛋白质—蛋白质相互作用位点预测研究[D];西北工业大学;2006年
3 安书君;改进的蛋白质相互作用位点预测方法研究[D];哈尔滨工业大学;2006年
4 胡佳;用生物统计方法预测蛋白质相互作用[D];同济大学;2007年
5 马雅楠;改进的系统发育谱方法在蛋白质功能预测中的应用[D];东北师范大学;2008年
6 陆林英;基于序列从头预测法的蛋白质相互作用研究[D];东北师范大学;2008年
7 张小丹;基于支持向量机的基因表达数据特征选取方法研究[D];苏州大学;2008年
8 蔡钊;蛋白质网络中相互作用及功能预测算法的研究[D];中南大学;2008年
9 代利坚;蛋白质相互作用预测及其假阳性过滤研究[D];中南大学;2009年
10 杨晓飞;基于多源数据融合的蛋白质—蛋白质相互作用网络构建方法研究[D];中国科学技术大学;2009年
【二级引证文献】
中国期刊全文数据库 前2条
1 彭利红;刘海燕;唐启涛;;蛋白质相互作用预测方法研究进展[J];计算机光盘软件与应用;2012年18期
2 李娟娟;陈月辉;;蛋白质相互作用研究方法的分析[J];信息技术与信息化;2012年05期
中国硕士学位论文全文数据库 前2条
1 田建芳;PPI网络的群智能信息流模型与算法研究[D];陕西师范大学;2012年
2 何凤云;耐高温碱性蛋白酶生产菌20101的选育及酶学性质研究[D];吉林农业大学;2012年
【二级参考文献】
中国期刊全文数据库 前6条
1 王仁华,江辉;正反向隐马尔可夫模型及其在连续语音识别中的应用[J];电子学报;1996年10期
2 方锦清,汪小帆,刘曾荣;略论复杂性问题和非线性复杂网络系统的研究[J];科技导报;2004年02期
3 叶玉珍,解涛,丁达夫;蛋白质功能基团三维模体及其应用[J];科学通报;2000年12期
4 吴金闪,狄增如;从统计物理学看复杂网络研究[J];物理学进展;2004年01期
5 史定华;网络——探索复杂性的新途径[J];系统工程学报;2005年02期
6 周涛,傅忠谦,牛永伟,王达,曾燕,汪秉宏,周佩玲;复杂网络上传播动力学研究综述[J];自然科学进展;2005年05期
【相似文献】
中国期刊全文数据库 前10条
1 张玲,林澄涛,王恒;基因组范围的蛋白质功能研究方法初探[J];生物化学与生物物理进展;2001年05期
2 刘秀艳,滕胜;应用计算机识别蛋白质功能[J];生命的化学;2000年03期
3 张成林;李建远;;蛋白质相互作用的研究方法[J];中外医学研究;2011年04期
4 王大成;;蛋白质的三维结构研究[J];生物化学与生物物理进展;1980年05期
5 ;增强食欲的蛋白质[J];生命世界;2006年05期
6 陈丽娜;王倩;尚玉奎;张良才;孙钊;何伟明;赵研;李琬;王宏;何月涵;李霞;;人类蛋白质结构互作网络——结构域对网络拓扑与蛋白质功能的影响[J];生物化学与生物物理进展;2010年05期
7 陶站华,王淑静,刘兴汉;蛋白质转导技术及其应用[J];医学分子生物学杂志;2005年02期
8 高飞雪;杨俊林;;我国科学家在蛋白质功能设计领域取得重要进展[J];中国科学基金;2007年05期
9 杨运春;;“生命活动的主要承担者——蛋白质”的教学设计[J];生物学通报;2008年07期
10 王祥余;朴永哲;翟明昌;王晓丹;程贺;赵长新;;酿酒酵母FFC2146胞内蛋白及胞外蛋白双向电泳条件优化及图谱建立[J];微生物学通报;2011年02期
中国重要会议论文全文数据库 前10条
1 刘银坤;;疾病蛋白质组学研究重点和临床应用展望[A];中华医学会第七次全国检验医学学术会议资料汇编[C];2008年
2 高飞;;泛素样蛋白NEDD8对乳腺癌相关蛋白3(BCA3)的修饰及BCA3对NFκB活性的抑制[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
3 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
4 林东海;;用异核多维NMR技术测定蛋白质的溶液结构[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
5 徐加豹;蔡浩洋;张义正;李校;;基于基因网络预测哺乳动物线粒体蛋白质的功能[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
6 张小伟 ;张群业 ;鲁静 ;黄秋花;;全反式维甲酸诱导NB4细胞分化蛋白组中蛋白修饰及Isoforms变化的初步研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
7 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
8 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
9 刘克良;梁远军;;肽类药物研究进展[A];2006第六届中国药学会学术年会大会报告集[C];2006年
10 许越;;非损伤型扫描离子选择电极技术及其在基因组研究后期的应用[A];生物膜与重大疾病学术研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 记者 吴仲国;日首次公开招募研究人员[N];科技日报;2001年
2 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
3 采访记者 姜洪良;弱碱性活蛋白 创造蛋白质功能的升级[N];中国食品质量报;2005年
4 记者 刘恕;我国启动四项重大科学研究计划[N];科技日报;2006年
5 记者 顾钢;科学家发现干细胞蛋白质调控新机制[N];科技日报;2007年
6 刘云涛;北大蛋白质功能设计研究获新进展[N];中国医药报;2007年
7 记者:周清春;蛋白质研究:触摸生命的本质[N];科技日报;2006年
8 华琳 王治强;我校三项“973”项目通过科技部验收[N];新清华;2005年
9 梁远军 刘克良;肽类药物研究: 无限风光在险峰[N];中国医药报;2007年
10 白京丽;我国应重视对糖的研究[N];中国医药报;2000年
中国博士学位论文全文数据库 前10条
1 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
2 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年
3 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年
4 董少忠;一个HSV-1刺激相关基因的克隆及其功能的初步分析[D];中国协和医科大学;2003年
5 李健峰;与HSV-1感染相关的细胞立即早期基因产物HTRP在细胞辅抑制因子复合物中功能的分析[D];中国协和医科大学;2004年
6 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年
7 孙承磊;基于数据挖掘技术的蛋白质功能预测研究[D];上海大学;2013年
8 段谟杰;蛋白质结构预测与结构比对方法的研究[D];华中科技大学;2009年
9 徐超;结构基因组数据库构建及蛋白质主链构象的计算分析[D];中国科学技术大学;2008年
10 李林辉;小立碗藓冷胁迫下表达序列标签分析及其相关基因Cor166的功能初探[D];首都师范大学;2005年
中国硕士学位论文全文数据库 前10条
1 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
2 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年
3 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
4 贾元丰;基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测[D];山西大学;2013年
5 蔡娟;基于蛋白质相互作用网络及聚类算法的蛋白质功能预测方法研究[D];中南大学;2012年
6 胡伟凤;基于不确定网络的蛋白质功能模块挖掘算法研究[D];湖南大学;2013年
7 刘钦锋;蛋白质序列编码与功能预测[D];湖南大学;2011年
8 黄淑云;基于序列的蛋白质功能预测研究[D];南昌大学;2012年
9 呙中美;基于融合特征的蛋白质亚细胞定位预测[D];湖南大学;2012年
10 龚小龙;SAPs对蛋白质功能影响特征分析及性能评估[D];华中科技大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026