收藏本站
《浙江大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用

叶镇清  
【摘要】:在细胞体内,为了完成某种特定功能的蛋白质之间往往会有相对较多的相互作用,从而形成一些生物大分子复合物或功能模块,如翻译蛋白的分子机器核糖体等。所谓“物以类聚,人以群分”,模块结构是许多生物网络以及其他实际复杂网络中常见也很重要的一个特征。从生物网络中找出这些模块成分,对于了解生命系统中的网络结构和分析网络动态变化都具有极为重要的意义。而如何准确高效的在生物网络中定位这些模块结构是许多研究工作的前提,也是当今网络生物学中一个非常具有挑战性和应用前景性的研究领域。 本论文通过对传统的广泛应用于网络模块定位的常规聚类算法的分析,我们指出了这类算法中影响其性能的弱点所在。无论是分裂式聚类算法(如GN算法)还是聚合式聚类算法(如Newman-fast算法),在其算法流程中,后续步骤里的网络节点都不能自由的在前面步骤里形成的模块间穿梭交换,而只能局限在其当前所在的模块里继续被划分或者聚合;这样就导致早期的一些不理想的模块结构不能在后期过程里得以修正,并且早期错误的划分或聚合很可能在后续过程里被继续积累放大。为了克服这种困难,我们开发了新的自适应聚类算法来优化网络的模块度函数,以获得更佳的模块划分结果。在自适应聚类算法中,我们把网络里的每个节点都看成自治的主体,每个节点能根据其自身受到所在模块的引力以及外部模块对它的往外的拉力,从而自主决定其模块归属和去向,通过众节点的自组织行为,系统能自发呈现出理想的阶段性模块结构,而后通过反复的模块合并流程和自组织调整流程,最终获取最优的模块划分结构。此外,我们将上述算法编制成了Java程序以便应用,从而为我们能在系统的层面上对生物网络作进一步的深入研究提出了基础工具。 通过与当今著名的Newman-fast算法的比较,我们的算法在准确程度和时间效率上都取得了显著的提高。如在人工构建的模拟测试网络上将预测准确率从40.0%提高到了74.0%左右;在实际网络应用测验中,自适应聚类算法的表现也都要优于Newman-fast算法,其获得的模块结构都更加接近真实标准分类。 同时,我们将自适应聚类算法应用到了酵母蛋白质相互作用网络上,获取了36个拓扑模块,通过对这些模块的GO注释等生物学分析,结果表明这些拓扑模块与它们在生物学意义上的功能模块划分相当吻合,说明我们的算法可以很好的应用于规模较大的生物网络中。另外,与Newman-fast在同样的酵母网络上的应用也作了比较,计算结果表明自适应聚类算法能够非常快速(约40倍)的获得结果,并且其模块结构的蛋白成员在生物学功能上的关联要更加紧密一些。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:Q811.4

【共引文献】
中国期刊全文数据库 前10条
1 黄树林;鞠颂东;董军;;企业集团网络化物流模式的结构分析[J];北京交通大学学报(社会科学版);2011年01期
2 尹向敏;李元左;罗小明;;陆军武器装备综合集成系统复杂性研究[J];兵工自动化;2007年10期
3 程连元;杨柳青;柳应华;宗刚;;面向市政管理的不良信息传播仿真模型[J];北京工业大学学报;2011年04期
4 陈宏斌;胡延庆;狄增如;;元胞自动机法寻找社团结构[J];北京师范大学学报(自然科学版);2008年02期
5 周宏达;陈守刚;杨德刚;;主城区公路网的复杂网络特征分析[J];成都大学学报(自然科学版);2009年04期
6 李耀华;姚洪兴;;金融危机下股市网络的结构特性研究[J];成都信息工程学院学报;2010年01期
7 杨光华;谢小良;;基于加权超网络的区域物流网络模型及特征分析[J];湖南文理学院学报(自然科学版);2008年03期
8 尹礼寿;闫喜红;;复杂网络中具有媒介传播SIS模型的稳定性分析[J];长春大学学报;2010年04期
9 胡永生;杨玲玲;;基于多重图形剖分算法的免疫策略[J];传感器与微系统;2010年10期
10 阎艳;黄智兴;邱玉辉;;一种基于派系过滤的社区进化发现研究[J];重庆师范大学学报(自然科学版);2009年02期
中国重要会议论文全文数据库 前10条
1 郑新奇;苏艳军;杨光;王淑晴;;城市道路网络复杂性的研究方法——空间句法与复杂网络模型的集成分析[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
2 《基于学术交流的技术创新人才培养研究》课题组;陈雄辉;;基于学术交流的技术创新人才培养研究[A];学术交流质量与科技研发创新研究[C];2009年
3 王建功;李平辉;谭欢;;B-A模型的改进模型[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(下册)[C];2008年
4 李小叶;王红蕾;;城市公共交通网络的级联失效研究[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
5 ;Method to Find Community Structures from Mobile Communication Data[A];Proceedings of 2006 International Symposium on Distributed Computing and Applications to Business, Engineering and Science[C];2006年
6 李继新;;复杂网络社团结构算法的实例分析[A];2009中国控制与决策会议论文集(3)[C];2009年
7 章忠志;周水庚;方锦清;;复杂网络确定性模型研究的最新进展[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
8 方锦清;汪小帆;郑志刚;;非线性网络的动力学复杂性研究的进展概况[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
9 郑志刚;;复杂网络与部分同步:理论与应用[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
10 汪小帆;苏厚胜;;复杂动态网络控制研究进展[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 杜文博;面向航空交通系统的复杂网络与网络动力学研究[D];中国科学技术大学;2010年
2 籍艳;几类时滞系统的稳定与同步[D];江南大学;2010年
3 徐旭林;社会群体行为建模及其动力学分析[D];南开大学;2010年
4 杨树忠;复杂网络中的社团检测问题研究[D];北京交通大学;2009年
5 李一啸;基于复杂网络和演化博弈理论的社会[D];浙江大学;2010年
6 张建辉;节点势能导向多下一跳路由协议研究与性能评价[D];解放军信息工程大学;2009年
7 高磊;P2P工作流系统中的资源搜索及负载均衡优化研究[D];山东大学;2010年
8 郭迟;基于复杂网络的Internet脆弱性研究[D];武汉大学;2010年
9 史伟;基于复杂网络的拓扑与信息传输问题研究[D];天津大学;2010年
10 王冰;复杂网络的演化机制及若干动力学行为研究[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 苏延森;刺激下拟南芥基因逻辑网络构建与分析[D];山东科技大学;2010年
2 李二艳;刺激下拟南芥基因相关网络构建与分析[D];山东科技大学;2010年
3 周斌;复杂网络的社团结构挖掘及应用研究[D];广西师范学院;2010年
4 高萌;复杂神经元网络的同步问题研究[D];哈尔滨工程大学;2010年
5 李玥亭;互联网社区核及完整社区提取策略[D];大连理工大学;2010年
6 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
7 孔健;基于半监督学习的社团划分算法研究[D];辽宁师范大学;2010年
8 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
9 王鹏;拓扑结构对Hindmarsh-Rose神经元放电模式调控作用的理论研究[D];安徽师范大学;2010年
10 张胜虎;基于复杂网络的南昌市公交网络优化研究[D];南昌大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 徐鸽;陈江瑞;;聚类分析在客户关系管理中的应用研究[J];企业技术开发;2008年01期
2 成娅辉;张英杰;;聚类算法在电信客户细分中应用效果的对比研究[J];邵阳学院学报(自然科学版);2009年04期
3 朱屹;刘安丰;;空间数据挖掘中的聚类算法[J];黑龙江科技信息;2011年13期
4 李艳灵;魏涛;;基于轮廓波变换的模糊聚类图像分割[J];信阳师范学院学报(自然科学版);2011年03期
5 严丽平;;基于数据挖掘的电信客户细分模型的分析与设计[J];科技广场;2007年05期
6 蔡俊伟;胡寿松;陶洪峰;;基于选择性支持向量机集成的混沌时间序列预测[J];物理学报;2007年12期
7 赵伟丽;张志国;;蚁群聚类算法的改进和实现[J];科技信息(学术研究);2008年02期
8 刘合兵;尚俊平;;基于距离和密度的聚类和孤立点检测算法[J];河南师范大学学报(自然科学版);2008年03期
9 王洁松;张小飞;;KDDCup99网络入侵检测数据的分析和预处理[J];科技信息(科学教研);2008年15期
10 吴强;;一般信息系统的PoClustering与概念格[J];绍兴文理学院学报(自然科学版);2008年03期
中国重要会议论文全文数据库 前10条
1 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
3 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
4 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
5 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
6 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
8 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 余琳;邓玲;;常见聚类算法的比较以及DSS系统中的应用[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 本报记者 夏俭军;中国重汽舞剑改装厂谁是下一个? Who is the next Target to be Purchased by CNHTC?[N];机电商报;2008年
2 李琦;美国Target两招闯天下[N];中国商报;2002年
3 界龙;上海外贸界龙通过TARGET公司供应商审核[N];中国包装报;2010年
4 晨笛 编译;亚历山大·麦克奎因为Target设计服装[N];中国服饰报;2008年
5 ;资讯创造价值知讯者生存[N];国际商报;2005年
6 李兵;SoftFSB在Windows下超频CPU[N];中国电脑教育报;2002年
7 华中理工大学(430074)西边第十六舍16# 喻锋荣;用ASP实现树形目录视图[N];计算机世界;2001年
8 邓海燕;品牌重塑:即使著名也要出新[N];经济参考报;2009年
9 无尾狐;巧用VBA实现数据快速录入[N];中国电脑教育报;2004年
10 马雪芬/编译整理;2004美国传媒十大收购[N];中国图书商报;2005年
中国博士学位论文全文数据库 前10条
1 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
2 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
3 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
4 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
5 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
6 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
7 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
8 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
9 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
10 李强;动点聚类算法及其量子化研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
2 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
3 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
4 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
5 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
6 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
7 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
8 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
9 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
10 张立;基于新闻评论数据的K-means聚类算法的研究[D];太原理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026