收藏本站
《湖南大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于聚类算法和相互作用网络的蛋白质功能预测研究

刘昊  
【摘要】: 蛋白质相互作用网络是计算机科学技术的一个新研究领域。蛋白质功能预测是蛋白质相互作用网络富有挑战性的问题之一。它的研究不仅可以直接阐明生命体在生理或病理条件下的变化机制,而且对生物制药,农业生物科技等应用领域同样具有直接的指导作用。 本文在深入分析现有蛋白质相互作用网络的聚类算法和蛋白质功能预测方法的基础上,对适合蛋白质相互作用网络的聚类算法和蛋白质功能预测问题进行了研究,提出一种新的聚类算法,并将聚类结果结合蚁群算法双序列比对来进行蛋白质功能预测,并进行了相应的实验分析,取得了较好的结果。论文主要工作包括: 总结出当前蛋白质功能预测所面临的挑战和困难。本文从蛋白质序列,结构与相互作用入手,研究了蛋白质相互作用及其网络统计参数和网络拓扑结构,并系统分析了蛋白质功能预测研究现状。 以往,蛋白质相互作用网络中结点之间的距离度量是需要通过基于网络的最短路径距离来重新定义,其计算代价高,这使得已有的基于欧几何距离的聚类算法不能直接运用到这种环境中。因此,通过蛋白质相互作用网络的特征提出了一种新的聚类算法。算法使用网络中的边和结点信息来缩减搜索空间,避免了一些不必要的距离计算。实验结果表明,算法对于真实的蛋白质相互作用网络中的结点聚类是高效的。 提出了利用蚁群算法双序列比对从蛋白质相互作用网络中预测孤立蛋白质与聚类中心蛋白质的相互作用,进而预测孤立蛋白质的功能。实验结果表明,该方法蛋白质功能预测中的应用是可行和有效的,对蛋白质序列进行测试并与基于局部比较的滑动窗口序列比对算法相比,可以得到较为满意的结果。
【关键词】:PPI网络 聚类方法 蚁群算法 蛋白质功能预测 孤立蛋白 序列比对
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:Q51-3;TP301.6
【目录】:
  • 摘要5-6
  • Abstract6-11
  • 插图索引11-12
  • 附表索引12-13
  • 第1章 绪论13-21
  • 1.1 选题背景和意义13
  • 1.2 生物信息学研究现状13-16
  • 1.3 生物信息学基本分析方法16-17
  • 1.3.1 序列比对预测法16
  • 1.3.2 结构比对预测法16
  • 1.3.3 功能比对预测法16-17
  • 1.4 生物信息学研究热点17-19
  • 1.4.1 基因组学17
  • 1.4.2 蛋白质组学17-18
  • 1.4.3 药物信息学18
  • 1.4.4 生物芯片研究18-19
  • 1.5 本文的主要工作及结构安排19-21
  • 1.5.1 本文的主要研究内容19
  • 1.5.2 本文的组织结构19-21
  • 第2章 PPI 网络及蛋白质功能预测概述21-30
  • 2.1 蛋白质相互作用21-23
  • 2.1.1 蛋白质相互作用的重要性21-22
  • 2.1.2 蛋白质相互作用的原理22-23
  • 2.2 蛋白质相互作用的评估23-25
  • 2.2.1 假阳性和假阴性24
  • 2.2.2 蛋白质相互作用数据的重叠和相互补充24-25
  • 2.2.3 可信度的评估和提高25
  • 2.3 PPI 网络的统计参数25-27
  • 2.4 蛋白质功能预测27-29
  • 2.5 小结29-30
  • 第3章 基于蛋白质相互作用网络的聚类算法30-43
  • 3.1 引言30-31
  • 3.2 基本定义31-32
  • 3.3 聚类衡量函数32
  • 3.4 基于边的聚类算法32-36
  • 3.4.1 算法的思想33
  • 3.4.2 算法描述33-36
  • 3.5 实验及比较分析36-42
  • 3.5.1 利用基于边的聚类算法进行聚类的结果36-38
  • 3.5.2 利用Maryland Bridge 方法进行聚类的结果38
  • 3.5.3 利用Korbel 方法进行聚类的结果38-39
  • 3.5.4 利用基于AAMV 的K-means 方法的聚类结果39
  • 3.5.5 实验结果的分析比较39-42
  • 3.6 小结42-43
  • 第4章 基于 PPI 网络的蛋白质功能预测43-57
  • 4.1 蛋白质相互作用网络及其构建43
  • 4.2 PPI 网络用于蛋白质功能预测43-46
  • 4.2.1 直接注释方法44
  • 4.2.2 基于序列的方法44-45
  • 4.2.3 基于模块的方法45-46
  • 4.2.4 基于复合数据的方法46
  • 4.3 功能预测的评估指标46-47
  • 4.4 蚁群算法原理及发展47-51
  • 4.4.1 蚁群算法基本原理及发展47-50
  • 4.4.2 蚁群算法在序列比对中的应用50-51
  • 4.5 实验及其分析51-56
  • 4.5.1 蚁群双序列比对算法51-53
  • 4.5.2 算法步骤53-54
  • 4.5.3 结果分析54-56
  • 4.6 小结56-57
  • 结束语57-59
  • 参考文献59-64
  • 致谢64-65
  • 附录 A 攻读硕士期间发表的论文和参加的项目65

【引证文献】
中国期刊全文数据库 前1条
1 吴爽;雷秀娟;;融合人工鱼群机理的PPI网络聚类模型与算法[J];计算机科学;2012年07期
中国硕士学位论文全文数据库 前3条
1 夏艳军;蛋白质相互作用数据库系统的构建及其应用[D];湖南农业大学;2010年
2 李寅珠;基于蛋白质相互作用网络的代谢pathway预测[D];天津师范大学;2012年
3 吴爽;基于群智能机理的PPI网络功能模块聚类[D];陕西师范大学;2012年
【参考文献】
中国期刊全文数据库 前8条
1 杨世坚,贺国光;基于模糊C均值聚类和神经网络的短时交通流预测方法[J];系统工程;2004年08期
2 陈娟;陈崚;;多重序列比对的蚁群算法[J];计算机应用;2006年S1期
3 蒋雄飞;杨洁;王炜;;Alzheimer’s疾病相关蛋白质相互作用网络构建及其相互作用预测[J];南京大学学报(自然科学版);2006年05期
4 卢宏超;石秋艳;石宝晨;张治华;赵屹;唐素勤;熊磊;王强;陈润生;;基于蛋白质网络功能模块的蛋白质功能预测[J];生物化学与生物物理进展;2006年05期
5 刘中扬;李栋;朱云平;贺福初;;蛋白质相互作用网络进化分析研究进展[J];生物化学与生物物理进展;2009年01期
6 张春霆;生物信息学的现状与展望[J];世界科技研究与发展;2000年06期
7 孙金福;涂长春;;病毒感染蛋白质组学研究进展[J];微生物学通报;2008年12期
8 陈龙;朱化彬;沙里金;王栋;王宗礼;程金华;郝海生;杜卫华;;蛋白质组学数据库建设的研究进展[J];畜牧与兽医;2008年08期
【共引文献】
中国期刊全文数据库 前10条
1 黄啸;;生物信息学在蛋白质组学上的应用[J];安徽农业科学;2006年23期
2 王勇;陈克平;姚勤;;系统发生分析软件PAUP和TreePuzzle使用方法介绍[J];安徽农业科学;2008年02期
3 王勇;陈克平;姚勤;;系统发生分析程序MrBayes 3.1使用方法介绍[J];安徽农业科学;2009年33期
4 王雯雯;武栓虎;;基于DNA双链特征的启动子预测方法[J];北京交通大学学报;2009年06期
5 秦洋;王立宏;武栓虎;宋宜斌;;基于拉普拉斯矩阵的DNA序列集相似性分析[J];北京交通大学学报;2009年06期
6 石鸥燕;杨文万;;生物信息数据库及其利用[J];包头医学院学报;2006年03期
7 向浏欣;谭军;;浅谈系统发生树构建方法[J];才智;2009年20期
8 吴建盛;吴建孟;;《生物信息学》——打造精品课程的契机[J];时代教育(教育教学);2010年10期
9 向恒;张瑞芝;潘国庆;周泽扬;;对蚕学专业引入基因组与生物信息学课程的思考[J];蚕学通讯;2011年04期
10 赵金城,王庆莉,毕秀玲;计算机辅助直接药物分子设计[J];大连大学学报;2002年06期
中国重要会议论文全文数据库 前5条
1 胡扬;桂卫华;;人工代谢技术在医药领域中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
2 姜春林;杜维滨;李江波;;药物分子设计技术领域的文献计量可视化分析[A];科学学理论与科学计量学探索——全国科学技术学暨科学学理论与学科建设2008年联合年会论文集[C];2008年
3 高亚梅;韩毅强;余丽芸;;生物信息学本科教学研究初探[A];高教科研2006(中册:教学改革)[C];2006年
4 杨长平;;生物信息学在畜禽基因组研究中的应用[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
5 高巾帼;田兴军;陈彬;朱静;杨昌林;李重琦;宋福强;;DNA分子标记技术在植物系统学研究中的应用[A];中国生物多样性保护与研究进展——第五届全国生物多样性保护与持续利用研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 龙海侠;进化算法及其在生物信息中的应用[D];江南大学;2010年
2 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
3 杨凡;生物序列分析中若干问题的研究[D];电子科技大学;2011年
4 徐兆华;基因芯片数据统合分析方法的若干拓展[D];浙江大学;2010年
5 陈欣;蛋白质在不同界面的识别、吸附及稳定性研究[D];浙江大学;2009年
6 顾全;基于集成智能的膜蛋白受体结构与功能研究[D];东华大学;2010年
7 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年
8 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
9 董浩;RNA二级结构预测方法研究[D];吉林大学;2011年
10 董春娇;多状态下城市快速路网交通流短时预测理论与方法研究[D];北京交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
2 吕俊杰;真核基因剪接位点识别算法研究[D];哈尔滨工程大学;2010年
3 史舵;基于主成分分析方法的蛋白质亚细胞定位[D];大连理工大学;2010年
4 梅丽;人类启动子识别算法研究[D];辽宁师范大学;2010年
5 高珍;浒苔生理生态特性和转录组研究[D];甘肃农业大学;2010年
6 战晓文;基于完全基因组且无序列比对的用于亲缘分析的严格距离度量[D];湘潭大学;2010年
7 王若飞;基于机器学习的蛋白质折叠预测算法研究[D];湘潭大学;2010年
8 刘广宾;分布式系统中实体交互行为的可信研究[D];湖南工业大学;2010年
9 卓立;中国滨藜亚科的地理分布与分子系统学研究[D];新疆农业大学;2010年
10 赵静静;F/10及G/11木聚糖酶家族的数学建模与分析[D];江南大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 雷秀娟;黄旭;吴爽;郭玲;;基于连接强度的PPI网络蚁群优化聚类算法[J];电子学报;2012年04期
2 孙宇;贾凌云;任军;;蛋白质相互作用的研究方法[J];分析化学;2007年05期
3 王正华;董蕴源;王勇献;;蛋白质相互作用网络的几种聚类方法综述[J];国防科技大学学报;2009年04期
4 张丽苹,霍克克;蛋白质相互作用研究技术进展[J];高技术通讯;2003年11期
5 司英健;蛋白质组学研究的内容、方法及意义[J];国外医学.临床生物化学与检验学分册;2003年03期
6 吴超;钟一文;;蛋白质功能预测的蚁群优化算法[J];广西师范大学学报(自然科学版);2011年03期
7 李舟军;陈义明;刘军万;陈火旺;;蛋白质相互作用研究中的计算方法综述[J];计算机研究与发展;2008年12期
8 刘白;周永权;;一种基于人工鱼群的混合聚类算法[J];计算机工程与应用;2008年18期
9 丁德武;陆克中;须文波;方康年;;代谢途径分析研究进展及其应用[J];计算机工程与应用;2009年33期
10 李松倍;谢江;张武;武频;;蛋白质相互作用网络的相似子网搜索问题研究[J];计算机工程与应用;2010年03期
中国博士学位论文全文数据库 前10条
1 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年
2 李艳文;信号Pathway预测方法研究[D];吉林大学;2011年
3 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
4 郑山红;信号转导pathway重构和组成要素识别方法研究[D];吉林大学;2011年
5 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
6 钟一文;智能优化方法及其应用研究[D];浙江大学;2005年
7 王俊伟;粒子群优化算法的改进及应用[D];东北大学;2006年
8 梁治;蛋白质相互作用网络的比较生物学分析及其应用[D];中国科学技术大学;2006年
9 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年
10 谢江;蛋白质相互作用网络的数值研究[D];上海大学;2008年
中国硕士学位论文全文数据库 前10条
1 刘彬彬;大规模蛋白质相互作用网络复合物挖掘算法研究[D];中南大学;2011年
2 曹建平;生物信息学方法研究蛋白质相互作用[D];电子科技大学;2005年
3 罗军珍;XML在关系数据库中存储方法的研究[D];重庆大学;2005年
4 赵一雪;基于XML数据库的数据查询优化的研究[D];哈尔滨工程大学;2006年
5 刘金洋;粒子群优化算法的研究与改进[D];哈尔滨工业大学;2006年
6 郑晓鸣;人工鱼群算法的改进及应用[D];上海海事大学;2006年
7 王梅娟;XML数据的规范化存储[D];南京师范大学;2007年
8 李延恩;蛋白质相互作用网络的模块结构辨识[D];华中科技大学;2006年
9 莫春玲;复杂网络中聚类方法及社团结构的研究[D];武汉理工大学;2007年
10 彭利红;基于蛋白质相互作用网络的聚类和稀疏点检测算法研究[D];湖南大学;2008年
【二级引证文献】
中国期刊全文数据库 前1条
1 赵贵喜;王岩;于冰;季念坤;;基于人工鱼群聚类的雷达信号分选算法[J];雷达科学与技术;2013年04期
中国硕士学位论文全文数据库 前1条
1 杨增桥;大规模群体动画中无碰撞路径规划研究[D];山东师范大学;2014年
【二级参考文献】
中国期刊全文数据库 前9条
1 尹宏宾,徐建闽,周其节;城市交通网络交通量自适应模糊预测方法[J];公路交通科技;1998年03期
2 王宏杰,林良明,徐大淦,颜国正;基于改进BP网交通流动态时序预测算法的研究[J];交通与计算机;2001年03期
3 贾丹;基于神经网络的交通流的预测[J];锦州师范学院学报(自然科学版);2002年03期
4 谭国真,丁浩;广义神经网络的研究及其在交通流预测中的应用[J];控制与决策;2002年S1期
5 成海平,钱小红;蛋白质组研究的技术体系及其进展[J];生物化学与生物物理进展;2000年06期
6 何大澄,赵和平;从基因组学到蛋白质组学[J];生物学通报;2002年09期
7 贺国光,李宇,马寿峰;基于数学模型的短时交通流预测方法探讨[J];系统工程理论与实践;2000年12期
8 吴松锋,朱云平,贺福初;人类蛋白质组表达谱蛋白质鉴定的分步搜索策略[J];遗传;2005年05期
9 石铁流,李亦学;系统生物学的现状与展望[J];中国科学基金;2005年05期
中国硕士学位论文全文数据库 前1条
1 刘珍;蛋白质组学中的生物信息学研究[D];湖南师范大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 张玲,林澄涛,王恒;基因组范围的蛋白质功能研究方法初探[J];生物化学与生物物理进展;2001年05期
2 刘秀艳,滕胜;应用计算机识别蛋白质功能[J];生命的化学;2000年03期
3 张成林;李建远;;蛋白质相互作用的研究方法[J];中外医学研究;2011年04期
4 王大成;;蛋白质的三维结构研究[J];生物化学与生物物理进展;1980年05期
5 ;增强食欲的蛋白质[J];生命世界;2006年05期
6 陈丽娜;王倩;尚玉奎;张良才;孙钊;何伟明;赵研;李琬;王宏;何月涵;李霞;;人类蛋白质结构互作网络——结构域对网络拓扑与蛋白质功能的影响[J];生物化学与生物物理进展;2010年05期
7 陶站华,王淑静,刘兴汉;蛋白质转导技术及其应用[J];医学分子生物学杂志;2005年02期
8 高飞雪;杨俊林;;我国科学家在蛋白质功能设计领域取得重要进展[J];中国科学基金;2007年05期
9 杨运春;;“生命活动的主要承担者——蛋白质”的教学设计[J];生物学通报;2008年07期
10 王祥余;朴永哲;翟明昌;王晓丹;程贺;赵长新;;酿酒酵母FFC2146胞内蛋白及胞外蛋白双向电泳条件优化及图谱建立[J];微生物学通报;2011年02期
中国重要会议论文全文数据库 前10条
1 刘银坤;;疾病蛋白质组学研究重点和临床应用展望[A];中华医学会第七次全国检验医学学术会议资料汇编[C];2008年
2 高飞;;泛素样蛋白NEDD8对乳腺癌相关蛋白3(BCA3)的修饰及BCA3对NFκB活性的抑制[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
3 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
4 林东海;;用异核多维NMR技术测定蛋白质的溶液结构[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
5 徐加豹;蔡浩洋;张义正;李校;;基于基因网络预测哺乳动物线粒体蛋白质的功能[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
6 张小伟 ;张群业 ;鲁静 ;黄秋花;;全反式维甲酸诱导NB4细胞分化蛋白组中蛋白修饰及Isoforms变化的初步研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
7 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
8 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
9 刘克良;梁远军;;肽类药物研究进展[A];2006第六届中国药学会学术年会大会报告集[C];2006年
10 许越;;非损伤型扫描离子选择电极技术及其在基因组研究后期的应用[A];生物膜与重大疾病学术研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 记者 吴仲国;日首次公开招募研究人员[N];科技日报;2001年
2 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
3 采访记者 姜洪良;弱碱性活蛋白 创造蛋白质功能的升级[N];中国食品质量报;2005年
4 记者 刘恕;我国启动四项重大科学研究计划[N];科技日报;2006年
5 记者 顾钢;科学家发现干细胞蛋白质调控新机制[N];科技日报;2007年
6 刘云涛;北大蛋白质功能设计研究获新进展[N];中国医药报;2007年
7 记者:周清春;蛋白质研究:触摸生命的本质[N];科技日报;2006年
8 华琳 王治强;我校三项“973”项目通过科技部验收[N];新清华;2005年
9 梁远军 刘克良;肽类药物研究: 无限风光在险峰[N];中国医药报;2007年
10 白京丽;我国应重视对糖的研究[N];中国医药报;2000年
中国博士学位论文全文数据库 前10条
1 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
2 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年
3 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年
4 董少忠;一个HSV-1刺激相关基因的克隆及其功能的初步分析[D];中国协和医科大学;2003年
5 李健峰;与HSV-1感染相关的细胞立即早期基因产物HTRP在细胞辅抑制因子复合物中功能的分析[D];中国协和医科大学;2004年
6 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年
7 孙承磊;基于数据挖掘技术的蛋白质功能预测研究[D];上海大学;2013年
8 段谟杰;蛋白质结构预测与结构比对方法的研究[D];华中科技大学;2009年
9 徐超;结构基因组数据库构建及蛋白质主链构象的计算分析[D];中国科学技术大学;2008年
10 李林辉;小立碗藓冷胁迫下表达序列标签分析及其相关基因Cor166的功能初探[D];首都师范大学;2005年
中国硕士学位论文全文数据库 前10条
1 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
2 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年
3 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
4 贾元丰;基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测[D];山西大学;2013年
5 蔡娟;基于蛋白质相互作用网络及聚类算法的蛋白质功能预测方法研究[D];中南大学;2012年
6 胡伟凤;基于不确定网络的蛋白质功能模块挖掘算法研究[D];湖南大学;2013年
7 贾翠翠;基于随机游走的蛋白质功能预测算法设计与实现[D];黑龙江大学;2014年
8 刘钦锋;蛋白质序列编码与功能预测[D];湖南大学;2011年
9 黄淑云;基于序列的蛋白质功能预测研究[D];南昌大学;2012年
10 呙中美;基于融合特征的蛋白质亚细胞定位预测[D];湖南大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026