收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用

叶镇清  
【摘要】:在细胞体内,为了完成某种特定功能的蛋白质之间往往会有相对较多的相互作用,从而形成一些生物大分子复合物或功能模块,如翻译蛋白的分子机器核糖体等。所谓“物以类聚,人以群分”,模块结构是许多生物网络以及其他实际复杂网络中常见也很重要的一个特征。从生物网络中找出这些模块成分,对于了解生命系统中的网络结构和分析网络动态变化都具有极为重要的意义。而如何准确高效的在生物网络中定位这些模块结构是许多研究工作的前提,也是当今网络生物学中一个非常具有挑战性和应用前景性的研究领域。 本论文通过对传统的广泛应用于网络模块定位的常规聚类算法的分析,我们指出了这类算法中影响其性能的弱点所在。无论是分裂式聚类算法(如GN算法)还是聚合式聚类算法(如Newman-fast算法),在其算法流程中,后续步骤里的网络节点都不能自由的在前面步骤里形成的模块间穿梭交换,而只能局限在其当前所在的模块里继续被划分或者聚合;这样就导致早期的一些不理想的模块结构不能在后期过程里得以修正,并且早期错误的划分或聚合很可能在后续过程里被继续积累放大。为了克服这种困难,我们开发了新的自适应聚类算法来优化网络的模块度函数,以获得更佳的模块划分结果。在自适应聚类算法中,我们把网络里的每个节点都看成自治的主体,每个节点能根据其自身受到所在模块的引力以及外部模块对它的往外的拉力,从而自主决定其模块归属和去向,通过众节点的自组织行为,系统能自发呈现出理想的阶段性模块结构,而后通过反复的模块合并流程和自组织调整流程,最终获取最优的模块划分结构。此外,我们将上述算法编制成了Java程序以便应用,从而为我们能在系统的层面上对生物网络作进一步的深入研究提出了基础工具。 通过与当今著名的Newman-fast算法的比较,我们的算法在准确程度和时间效率上都取得了显著的提高。如在人工构建的模拟测试网络上将预测准确率从40.0%提高到了74.0%左右;在实际网络应用测验中,自适应聚类算法的表现也都要优于Newman-fast算法,其获得的模块结构都更加接近真实标准分类。 同时,我们将自适应聚类算法应用到了酵母蛋白质相互作用网络上,获取了36个拓扑模块,通过对这些模块的GO注释等生物学分析,结果表明这些拓扑模块与它们在生物学意义上的功能模块划分相当吻合,说明我们的算法可以很好的应用于规模较大的生物网络中。另外,与Newman-fast在同样的酵母网络上的应用也作了比较,计算结果表明自适应聚类算法能够非常快速(约40倍)的获得结果,并且其模块结构的蛋白成员在生物学功能上的关联要更加紧密一些。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 徐鸽;陈江瑞;;聚类分析在客户关系管理中的应用研究[J];企业技术开发;2008年01期
2 成娅辉;张英杰;;聚类算法在电信客户细分中应用效果的对比研究[J];邵阳学院学报(自然科学版);2009年04期
3 朱屹;刘安丰;;空间数据挖掘中的聚类算法[J];黑龙江科技信息;2011年13期
4 李艳灵;魏涛;;基于轮廓波变换的模糊聚类图像分割[J];信阳师范学院学报(自然科学版);2011年03期
5 严丽平;;基于数据挖掘的电信客户细分模型的分析与设计[J];科技广场;2007年05期
6 蔡俊伟;胡寿松;陶洪峰;;基于选择性支持向量机集成的混沌时间序列预测[J];物理学报;2007年12期
7 赵伟丽;张志国;;蚁群聚类算法的改进和实现[J];科技信息(学术研究);2008年02期
8 刘合兵;尚俊平;;基于距离和密度的聚类和孤立点检测算法[J];河南师范大学学报(自然科学版);2008年03期
9 王洁松;张小飞;;KDDCup99网络入侵检测数据的分析和预处理[J];科技信息(科学教研);2008年15期
10 吴强;;一般信息系统的PoClustering与概念格[J];绍兴文理学院学报(自然科学版);2008年03期
11 陈磊;余建坤;邢晓宇;;谱系聚类在综合国力分析中的应用[J];云南民族大学学报(自然科学版);2009年01期
12 林国平;陈磊松;;一种网格和分形维数的数据流聚类算法[J];郑州大学学报(理学版);2009年02期
13 韩晓峰;;基于自回归的高斯混合模型[J];科技风;2009年23期
14 王路漫;;FCM聚类算法在数字图书馆中的应用研究[J];内蒙古大学学报(自然科学版);2010年04期
15 彭兴媛;刘琼荪;王立威;;基于条件互信息下聚类的朴素贝叶斯分类算法[J];云南大学学报(自然科学版);2011年05期
16 陈双平,郑浩然,黄国锐,王煦法;可视化分析四肽构象空间中的模式[J];中国科学技术大学学报;2005年05期
17 周晓云;孙志挥;张柏礼;;一种大规模高维数据集的高效聚类算法[J];应用科学学报;2006年04期
18 赖立;许家珆;;利用聚类算法建立免疫模型自我库[J];实验科学与技术;2006年04期
19 潘庆丰;陈水利;陈国龙;;基于核函数的模糊C均值聚类算法[J];集美大学学报(自然科学版);2006年04期
20 焦誉;赖建章;柯佳;;一种基于密度的网格动态聚类算法的研究[J];安徽大学学报(自然科学版);2007年01期
中国重要会议论文全文数据库 前10条
1 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
3 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
4 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
5 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
6 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
8 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 余琳;邓玲;;常见聚类算法的比较以及DSS系统中的应用[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
2 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
3 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
4 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
5 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
6 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
7 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
8 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
9 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
10 李强;动点聚类算法及其量子化研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
2 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
3 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
4 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
5 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
6 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
7 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
8 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
9 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
10 张立;基于新闻评论数据的K-means聚类算法的研究[D];太原理工大学;2010年
中国重要报纸全文数据库 前10条
1 本报记者 夏俭军;中国重汽舞剑改装厂谁是下一个? Who is the next Target to be Purchased by CNHTC?[N];机电商报;2008年
2 李琦;美国Target两招闯天下[N];中国商报;2002年
3 界龙;上海外贸界龙通过TARGET公司供应商审核[N];中国包装报;2010年
4 晨笛 编译;亚历山大·麦克奎因为Target设计服装[N];中国服饰报;2008年
5 ;资讯创造价值知讯者生存[N];国际商报;2005年
6 李兵;SoftFSB在Windows下超频CPU[N];中国电脑教育报;2002年
7 华中理工大学(430074)西边第十六舍16# 喻锋荣;用ASP实现树形目录视图[N];计算机世界;2001年
8 邓海燕;品牌重塑:即使著名也要出新[N];经济参考报;2009年
9 无尾狐;巧用VBA实现数据快速录入[N];中国电脑教育报;2004年
10 马雪芬/编译整理;2004美国传媒十大收购[N];中国图书商报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978