收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

聚类算法研究及其在网络模块性分析中的应用

孙鹏岗  
【摘要】:随着信息化社会的发展,大多数复杂系统都可以建模成一个网络模型(图模型),通过对该网络模型的研究,可以有利地帮助我们理解复杂系统的功能。复杂系统的一个重要特性就是“模块性”(Modularity),这种特性表现为模块内部的节点连接比较稠密,模块间的节点连接比较稀疏。在社会网络中称之为“社团结构”(Community Structure),生物网络中称之为“功能模块”(Functional Modules)。通过对这种特性的研究可以更好的帮助我们理解复杂系统的机能和特性,且对复杂系统的控制、预测、变化和发展都具有至关重要的意义。 针对复杂网络系统的模块性,本文着重研究网络模块性分析的聚类算法及其在真实网络中的应用: (1)提出一种基于模糊聚类的网络模块性分析方法。与现有算法不同之处在于,该算法不再通过一个图模型上的遍历搜索来寻找模块,即社团结构,而是把网络建模成一个模糊关系模型,通过模糊关系的运算(模糊关系的合成)来达到识别社团结构的目的。基于社团结构与等价类的共性(自反性、对称性、传递性),建立起两者间的一一对应关系,即把社团结构映射为满足某一等价关系的等价类。在人工网络与真实网络中的测试结果表明,该算法可以有效地识别网络中的已知社团,也可以用来识别重叠社团。 (2)基于上述建立的模糊关系模型,提出一种基于最小熵聚类的网络模块性分析方法。融合网络拓扑和熵的特性,利用一种基于熵的测度来刻画节点间的关系,且熵越小,节点间越相似,社团越稳定。然后提出一种新的模糊关系的合成规则,并通过该规则来完成节点间最小熵的传递。在人工网络与真实网络中的测试结果表明,该算法可以有效地识别网络中的已知社团。 (3)由于派系过滤算法(CPM)在识别蛋白质相互作用网络(Protein-Protein Interaction, PPI)中的功能模块时,没有考虑到派系对节点度的要求。针对这一点,提出一种基于派系过滤的快速迭代式聚类算法(ICPM)。该算法充分考虑到派系对节点度的要求,即k-派系里的节点的度至少为k-1,同时把识别k-派系转化为(k-1)-派系,通过递归的方式来实现从小派系到大派系的识别过程。与CPM算法相比,该算法减小了网络上识别社团的搜索空间,提高了效率。 (4)针对不同物种间PPI网络功能模块的保守性,提出一种基于模块比对的方法来识别物种间的保守功能模块。与传统的网络比对方法相比,模块比对先利用聚类算法把PPI网络进行模块化分解以此来降低问题的复杂度,然后通过不同物种蛋白质间的序列相似性,建立起不同物种模块间的映射关系,从而达到识别保守模块的目的。该算法识别出来的保守模块在功能注释上具有很高的一致性,且从MCL算法分解的模块中识别出来的保守模块优于其它算法。但是,由于对网络进行了分解,破坏了整个网络结构,导致有些保守模块难以识别。 (5)导致相似疾病的基因其蛋白质产物会在PPI网络中表现出很紧密的交互性,这也可近似为模块性。针对这一特性,提出一种基于聚类分析的PPI网络中疾病相关模块的预测方法。通过一种集成多个生物证据的概率化模型来刻画疾病相关模块,且得分越高与疾病的关联性越大。结果表明CPM算法分解的模块做为候选的疾病相关模块优于MCL算法与MCODE算法,同时还发现大多数疾病相关模块都由Tissue-Specific Genes组成,且只在少部分人类组织(Human Tissues)共表达(Co-Expressed),少数疾病相关模块由House Keeping Genes (Maintenance Genes)组成,且在大部分人类组织共表达。 本文研究网络模块性分析的聚类算法及其在真实网络中的应用,特别是PPI网络中功能模块的识别以及疾病相关模块的预测。此外对于其它具有相似结构的复杂网络本文所讨论的算法也具有适用性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵伟丽;张志国;;蚁群聚类算法的改进和实现[J];科技信息(学术研究);2008年02期
2 张天伍;李卫平;;一种基于密度的引力聚类算法[J];河南科学;2008年11期
3 梅娟;何胜;李炜疆;;基于图聚类的蛋白质相互作用网络功能模块探测[J];食品与生物技术学报;2011年01期
4 王圆妹;;一种改进的K-均值聚类算法的研究[J];长江大学学报(自科版)医学卷;2006年10期
5 俞辉;裴振奎;陈继东;;一种改进的蚁群聚类算法[J];郑州大学学报(理学版);2010年03期
6 周峰;陈基漓;陈欢;;基于高斯核的KSOFM聚类算法研究[J];大众科技;2011年02期
7 徐鸽;陈江瑞;;聚类分析在客户关系管理中的应用研究[J];企业技术开发;2008年01期
8 韩晓峰;;基于自回归的高斯混合模型[J];科技风;2009年23期
9 焦誉;赖建章;柯佳;;一种基于密度的网格动态聚类算法的研究[J];安徽大学学报(自然科学版);2007年01期
10 王路漫;;FCM聚类算法在数字图书馆中的应用研究[J];内蒙古大学学报(自然科学版);2010年04期
11 童树鸿,沈毅,刘志言;基于聚类分析的模糊分类系统构造方法[J];控制与决策;2001年S1期
12 步媛媛;关忠仁;;基于K-means聚类算法的研究[J];西南民族大学学报(自然科学版);2009年01期
13 钱锋,徐麟文;知识发现中的聚类分析及其应用[J];杭州师范学院学报(自然科学版);2001年01期
14 刘靖明,韩丽川,侯立文;基于粒子群的K均值聚类算法[J];系统工程理论与实践;2005年06期
15 严会超;陈联诚;王璐;李晴;薛月菊;杜国明;;采用综合加权聚类方法的农产品安全监测点规划[J];应用生态学报;2009年08期
16 张雪凤;刘鹏;;基于类间差异最大化的加权距离改进K-means算法[J];山东大学学报(理学版);2010年07期
17 罗静;刘宗歧;;基于网格聚类算法的电力营销预测研究[J];科技信息;2011年13期
18 韦相;李志勇;朱永缤;;基于质心的样本加权聚类算法[J];成都大学学报(自然科学版);2011年02期
19 丁春荣;杨宝华;;基于SOFM网络的改进K-均值聚类算法[J];科技导报;2009年10期
20 木妮娜,古丽娜;图像数据库智能检索系统中聚类算法的设计与实现[J];新疆师范大学学报(自然科学版);2005年01期
中国重要会议论文全文数据库 前10条
1 杨柳;钟诚;陆向艳;;基于P2P网络的分布式聚类算法研究分析[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
2 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 史金成;胡学钢;;基于约束的数据流聚类研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
5 宣照国;刘建国;党延忠;;基于公共邻居的一类复杂网络快速聚类算法[A];2006全国复杂网络学术会议论文集[C];2006年
6 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
7 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
8 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
9 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
10 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
2 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
3 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
4 高若阳;基于知识观的组织模块性与企业适应性研究[D];浙江大学;2010年
5 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
6 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
7 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
8 唐东明;聚类分析及其应用研究[D];电子科技大学;2010年
9 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
10 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 李慧慧;基于GIS的空间聚类算法的研究与应用[D];贵州大学;2008年
2 刘赏;结合密度思想的蚂蚁聚类算法[D];河北工业大学;2003年
3 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
4 徐勇;分析型CRM中聚类算法的研究[D];兰州理工大学;2010年
5 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
6 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
7 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
8 庄怡雯;基于聚类算法的Web日志挖掘应用研究[D];东华大学;2011年
9 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
10 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
中国重要报纸全文数据库 前10条
1 新疆 赵作清;好用的三端可调稳压模块[N];电子报;2003年
2 许同和 徐德池;C4系统简介[N];解放军报;2005年
3 西安协同数码股份有限公司 张敬波;甩掉流程变更的麻烦[N];计算机世界;2003年
4 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
5 ;模块化路由器面面观[N];科技日报;2000年
6 ;电信核心网构建之法[N];网络世界;2004年
7 熊哲宏;儿童发展的先天后天相互作用的动力论[N];中华读书报;2002年
8 记者 王巧然;法国ECA HYTEC公司推出新型电力驱动深海海下作业车[N];中国石油报;2006年
9 ;视频数据中挖“宝”[N];计算机世界;2002年
10 刘然;运营商如何构建电信级的核心网络?[N];中国经营报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978