收藏本站
《西安电子科技大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质网络模块结构识别算法研究

鱼亮  
【摘要】:识别蛋白质相互作用网络中的模块结构,是理解细胞功能的组织结构以及动态性的第一步。分析蛋白质网络的拓扑特性,以其模块性为基础,从蛋白质网络中识别有意义的蛋白质复合体和功能模块、注释未知的蛋白质功能、为已知功能的蛋白质预测新功能正成为当前国内外研究的热点问题。 本文基于蛋白质网络的拓扑特性,研究了有效识别蛋白质复合体和功能模块的算法。进一步,将模块结构识别算法研究推广到复杂网络中。主要研究工作包括: 基于MCODE(Molecular Complex Detection)和GN(Girvan and Newman)算法,提出一种识别蛋白质复合体的新算法。分析了MCODE和GN算法的优缺点,根据蛋白质网络的拓扑结构,提出一种组合MCODE和GN的新算法。将算法应用于酵母蛋白质网络中,它可以快速地识别更稠密的模块,而且识别的蛋白质复合体与MIPS(Munich Information Center for Protein Sequences)中已知复合体具有高的重合率。这说明新算法可以识别更多具有生物意义的蛋白质复合体。 对蛋白质复合体结构的深入研究发现,它主要由一个核和一些附件构成。根据复合体核和附件所具有的特性,提出一种基于局部密度和随机游走的蛋白质复合体识别算法。基于子网络的局部密度找到所有的复合体核,利用随机游走为每一个核查找附件蛋白质,从而构成蛋白质复合体。将算法应用于无权和有权的酵母蛋白质网络。通过与MIPS和GO(Gene Ontology)中已知蛋白质复合体比较,讨论预测复合体的生物意义,并与现有一些算法进行全面的分析比较。结果表明,我们的算法可以找到更多具有生物意义的复合体。而且,它可以识别具有生物意义的重叠复合体。 根据最大频繁模式和复合体核的特性,提出一种基于最大频繁模式识别核-附件结构蛋白质复合体算法。通过挖掘最大频繁模式检测蛋白质网络中具有较高度的子图,将其作为候选核。对得到的候选核做进一步处理:利用拓扑和功能相似性,合并最相似的核并过滤无意义的核。为每一个有意义的核添加附件蛋白质,从而构成蛋白质核-附件结构复合体。在酵母蛋白质网络上,利用标准蛋白质复合体、GO和位置注解等对算法进行性能评估,并与几个具有代表性的算法进行全面比较。实验结果表明,预测复合体在查全率、查准率,以及生物意义方面都好于现有算法。在共位置相似性方面,预测复合体集合高于已知复合体集合。而且,与其他基于子图连通性的算法相比,新算法可以检测到GO富集度高的具有非连通核的蛋白质复合体。 基于模块内部边和模块间的边,以及网络平均度,给出一种新的蛋白质模块定义,并据新定义提出评估蛋白质网络划分的度量函数。作为度量函数的进一步应用,提出一种分层凝聚算法检测蛋白质复合体。将算法应用于酵母蛋白质网络,识别的蛋白质复合体与已知蛋白质复合体进行比较分析,并将算法各方面性能与其他几个典型蛋白质复合体识别算法进行比较。新算法对蛋白质相互作用大规模数据中普遍存在的比例较高的假阳性和假阴性具有很好的健壮性,能够在蛋白质相互作用数据还不完善且具有较高噪声的情况下有效地识别蛋白质复合体。此外,它既可以预测有意义的稠密蛋白质复合体,又可以预测稀疏的有意义复合体。 对于复杂网络模块分解问题,基于社团的局部连通性,提出新的评估复杂网络划分的定量指标函数。由于广泛用于识别复杂网络社团结构的模块性函数Q具有分解极限。因此,新定量指标函数——度模块性(degree modularity, DQ)被提出来。证实DQ可以改进模块性Q的分解极限。而且,将其应用于不同真实网络和人工网络时,它可以敏感、可靠地检测到各种规模的社团结构。即使在大规模的生物网络,如蛋白质网络,也可以识别与已知复合体匹配率很高的蛋白质模块。 本文提出几种从不同角度研究蛋白质网络模块结构识别的聚类算法,同时将模块结构识别算法研究扩展到复杂网络中。本文提出的聚类算法具有很好的聚类效果,识别的蛋白质复合体或功能模块从统计意义上证明是有生物意义的,有效预测了一定数量的未知蛋白质功能,将会对生物学家进行蛋白质复合体或功能模块识别实验和进一步研究提供有价值的参考信息。此外,针对衡量复杂网络模块性提出的定量指标函数,对于真实网络和人工网络都表现出良好的性能。
【学位授予单位】:西安电子科技大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP301.6;O157.5

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 解(亻刍);汪小帆;;复杂网络中的社团结构分析算法研究综述[J];复杂系统与复杂性科学;2005年03期
2 孙景春,徐晋麟,李亦学,石铁流;大规模蛋白质相互作用数据的分析与应用[J];科学通报;2005年19期
3 卢宏超;石秋艳;石宝晨;张治华;赵屹;唐素勤;熊磊;王强;陈润生;;基于蛋白质网络功能模块的蛋白质功能预测[J];生物化学与生物物理进展;2006年05期
【共引文献】
中国期刊全文数据库 前10条
1 宋威;刘宇;李晋宏;;基于数据库垂直表示的高效用项集挖掘算法研究[J];北方工业大学学报;2011年01期
2 白昊;王崑声;胡昌振;张刚;经小川;;基于FP-Growth算法及补偿性入侵证据的攻击意图识别[J];北京理工大学学报;2010年08期
3 杨晓耘;王敬敬;唐勃峰;;复杂网络视角下的产业网络研究[J];北京科技大学学报(社会科学版);2010年03期
4 万隆昌;聂承启;;基于FP-Tree的遍历算法[J];江西师范大学学报(自然科学版);2005年06期
5 栗晓聪;滕少华;;频繁项集挖掘的Apriori改进算法研究[J];江西师范大学学报(自然科学版);2011年05期
6 刘独玉;杨晋浩;钟守铭;;关联规则挖掘研究综述[J];成都大学学报(自然科学版);2006年01期
7 孙智勇;刘星;;基于关联规则挖掘方法的结构性减税实证研究[J];重庆大学学报(社会科学版);2010年01期
8 ;Research on Community Structure in Bus Transport Networks[J];Communications in Theoretical Physics;2009年12期
9 张星;李蓓;;FP-Growth关联规则挖掘的改进算法[J];平顶山工学院学报;2008年01期
10 戴小廷;陈荣思;;数据挖掘在电力系统中的应用[J];重庆科技学院学报(自然科学版);2009年03期
中国重要会议论文全文数据库 前5条
1 ;The Application of Fuzzy Clustering in the Analysis of Community Structure[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 方锦清;汪小帆;郑志刚;;非线性网络的动力学复杂性研究的进展概况[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
3 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 王孟;白清源;谢丽聪;谢伙生;张莹;;基于信息增益规则排序的关联文本分类[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
5 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
中国博士学位论文全文数据库 前10条
1 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年
2 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
3 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
4 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
5 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年
6 程文聪;面向大规模网络安全态势分析的时序数据挖掘关键技术研究[D];国防科学技术大学;2010年
7 马晓普;角色工程中的角色与约束生成方法研究[D];华中科技大学;2011年
8 李伟;复杂网络特征结构的挖掘方法研究[D];南京理工大学;2010年
9 朱天;社会网络中节点角色以及群体演化研究[D];北京邮电大学;2011年
10 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘志强;基于数据挖掘的客户行为分析和预测研究[D];山东科技大学;2010年
2 李威;多参数扰动的隐私保护关联规则挖掘算法研究[D];哈尔滨工程大学;2010年
3 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
4 王富强;基于iceberg概念格的最大频繁项集挖掘研究[D];江苏大学;2010年
5 童建飞;数据挖掘在电信移动客户行为分析中的应用研究[D];南昌大学;2010年
6 陈鹏;数据流关联规则挖掘研究及其应用[D];浙江大学;2011年
7 谢凯;基于复杂网络的我国通信行业创新能力研究[D];武汉理工大学;2010年
8 汪志贞;数据挖掘技术在短时交通流预测上的应用研究[D];西安电子科技大学;2010年
9 王蓓金;蛋白质网络模块分解的密度聚类算法研究[D];西安电子科技大学;2010年
10 郭鸿雁;基于数据挖掘的自适应网络安全审计系统的研究与实现[D];山东师范大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 黄海滨;王建新;邵平;;一种新的拓扑参数及其蛋白质网络关键节点识别[J];计算机应用研究;2009年08期
2 黄海滨;杨路明;王建新;李绍华;;基于复合参数的蛋白质网络关键节点识别技术[J];自动化学报;2008年11期
3 鱼亮;高琳;孙鹏岗;;蛋白质网络中复合体和功能模块预测算法研究[J];计算机学报;2011年07期
4 黄海滨;杨路明;王建新;李绍华;;基于最小点覆盖及多参数方法的关键蛋白识别[J];计算机工程与应用;2008年27期
5 ;深海探秘:海底发现“阿凡达”[J];科技传播;2010年17期
6 王红;王希诚;;随机走步软聚类识别蛋白质网交叠功能模块[J];计算机工程与应用;2011年09期
7 韩蒙;李建中;邹兆年;;从不确定图中发现K紧密子图[J];计算机科学与探索;2011年09期
8 严开明;模块结构的多处理机系统——EBR[J];计算机研究与发展;1983年09期
9 刘诚方,王忠琪;通用压缩和拉伸弹簧CAD应用软件的研究[J];天津大学学报;1984年01期
10 孟洛明;吕诚昭;;CCITT CHILL模块结构的问题及其解决办法[J];北京邮电大学学报;1991年03期
中国重要会议论文全文数据库 前10条
1 李令东;田瑞军;唐伟;邹汉法;赵宗保;;携异戊烯链小分子与蛋白质相互作用的研究[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
2 张智红;储军;秦岭松;骆清铭;;活细胞内多对蛋白质间相互作用的同步光学成像研究[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
3 陈吉楠;张红;Amy E.Keating;蒋太交;;多层次整合思路预测参与酵母囊泡转运的coiled coil介导的蛋白质相互作用[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
4 王红阳;;蛋白质相互作用谱研究的思考[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
5 杨晓明;王建;许望翔;虞东辉;杨永升;刘琼明;周颖;张翠莉;吴志豪;张万巧;刘涛;唐刘君;原艳芝;郝峰;金超智;贺福初;;人类肝脏重要蛋白质相互作用连锁图研究进展[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
6 朱泳璋;李擎天;褚嘉佑;石铁流;郭晓奎;;利用蛋白质相互作用网络系统分析百日咳杆菌相变异[A];2006中国微生物学会第九次全国会员代表大会暨学术年会论文摘要集[C];2006年
7 朱泳璋;李擎天;褚嘉佑;石铁流;郭晓奎;;利用蛋白质相互作用网络系统分析百日咳杆菌相变异[A];上海市预防医学会第二届学术年会论文汇编[C];2006年
8 许超;张家海;黄小娟;孙建萍;徐应琪;唐雅君;吴季辉;旌蕴逾;黄秋花;张庆华;;核磁共振波谱研究蛋白质相互作用[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
9 郭延芝;余乐正;李梦龙;;利用蛋白质序列信息预测蛋白质相互作用[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
10 夏献民;严定国;胡俊波;王桂华;徐戎;曾繁典;;蛋白质相互作用能作为药物研发的靶点吗[A];药学发展前沿论坛及药理学博士论坛论文集[C];2008年
中国重要报纸全文数据库 前10条
1 程家瑜;生物技术 欣欣向荣[N];中国社会科学院院报;2003年
2 胡德荣;蛋白质相互作用网络预测新方法被发现[N];健康报;2007年
3 甄蓓;我科学家成功绘制人类肝脏蛋白质相互作用网络连锁图[N];科技日报;2011年
4 白毅;我国计算生物学研究取得重要进展[N];中国医药报;2007年
5 余志平 编译;PCAs给我们带来了什么?[N];中国医药报;2007年
6 毛黎;美开发细胞内蛋白质相互作用标识技术[N];科技日报;2007年
7 中国建筑玻璃与工业玻璃协会、玻璃机械专业委员会主任 邵光华;以先进玻璃机械设备带动行业发展[N];中国建材报;2005年
8 筱 雪;上市公司再融资步伐放缓?[N];证券日报;2004年
9 记者 贺北时;摩托罗拉发布最新汽车传感器产品[N];中国汽车报;2004年
10 ;中远集运打造全新电子商务网站[N];中国远洋报;2004年
中国博士学位论文全文数据库 前10条
1 鱼亮;蛋白质网络模块结构识别算法研究[D];西安电子科技大学;2011年
2 李敏;蛋白质网络中复合物和功能模块挖掘算法研究[D];中南大学;2008年
3 黄海滨;基于网络节点拓扑参数的关键蛋白质识别研究[D];中南大学;2008年
4 杜秀全;基于智能计算的蛋白质相互作用预测方法研究[D];安徽大学;2010年
5 陈钢;生物网络分析及其在复杂疾病研究中的应用[D];中南大学;2012年
6 张万巧;细胞周期调控蛋白质相互作用网络及接头分子TANK募集细胞周期激酶PLK1抑制NF-κB信号通路的机制研究[D];中国人民解放军军事医学科学院;2010年
7 李非;病毒—宿主蛋白质相互作用网络计算分析关键技术研究[D];国防科学技术大学;2010年
8 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年
9 唐江宏;有机小分子与人血清白蛋白的相互作用研究[D];兰州大学;2006年
10 何文英;若干中草药活性组分与几种球状蛋白质相互作用的研究[D];兰州大学;2006年
中国硕士学位论文全文数据库 前10条
1 王峘;基于蛋白质网络的关键蛋白质识别方法研究[D];中南大学;2011年
2 徐萌;蛋白质网络比对[D];中国科学技术大学;2006年
3 韩秋连;蛋白质网络模块化方法研究[D];北京交通大学;2011年
4 王蓓金;蛋白质网络模块分解的密度聚类算法研究[D];西安电子科技大学;2010年
5 王宗尧;基于蛋白质网络的人类遗传致病基因预测算法研究[D];哈尔滨工业大学;2010年
6 王夏;大肠杆菌O157:H7蛋白质相互作用网络中模块的预测与分析[D];中国人民解放军军事医学科学院;2009年
7 丛君兹;基于小波和模糊关系的蛋白质信息检测[D];国防科学技术大学;2010年
8 秦笙;蛋白质相互作用预测及Hub蛋白分类与作用规律研究[D];内蒙古科技大学;2010年
9 胡华军;血管生成素相互作用蛋白的研究[D];浙江大学;2004年
10 丁玲;磁性微球的表面改性及其与蛋白质相互作用的微量热研究[D];武汉理工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026