收藏本站
《西安电子科技大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

聚类算法研究及其在网络模块性分析中的应用

孙鹏岗  
【摘要】:随着信息化社会的发展,大多数复杂系统都可以建模成一个网络模型(图模型),通过对该网络模型的研究,可以有利地帮助我们理解复杂系统的功能。复杂系统的一个重要特性就是“模块性”(Modularity),这种特性表现为模块内部的节点连接比较稠密,模块间的节点连接比较稀疏。在社会网络中称之为“社团结构”(Community Structure),生物网络中称之为“功能模块”(Functional Modules)。通过对这种特性的研究可以更好的帮助我们理解复杂系统的机能和特性,且对复杂系统的控制、预测、变化和发展都具有至关重要的意义。 针对复杂网络系统的模块性,本文着重研究网络模块性分析的聚类算法及其在真实网络中的应用: (1)提出一种基于模糊聚类的网络模块性分析方法。与现有算法不同之处在于,该算法不再通过一个图模型上的遍历搜索来寻找模块,即社团结构,而是把网络建模成一个模糊关系模型,通过模糊关系的运算(模糊关系的合成)来达到识别社团结构的目的。基于社团结构与等价类的共性(自反性、对称性、传递性),建立起两者间的一一对应关系,即把社团结构映射为满足某一等价关系的等价类。在人工网络与真实网络中的测试结果表明,该算法可以有效地识别网络中的已知社团,也可以用来识别重叠社团。 (2)基于上述建立的模糊关系模型,提出一种基于最小熵聚类的网络模块性分析方法。融合网络拓扑和熵的特性,利用一种基于熵的测度来刻画节点间的关系,且熵越小,节点间越相似,社团越稳定。然后提出一种新的模糊关系的合成规则,并通过该规则来完成节点间最小熵的传递。在人工网络与真实网络中的测试结果表明,该算法可以有效地识别网络中的已知社团。 (3)由于派系过滤算法(CPM)在识别蛋白质相互作用网络(Protein-Protein Interaction, PPI)中的功能模块时,没有考虑到派系对节点度的要求。针对这一点,提出一种基于派系过滤的快速迭代式聚类算法(ICPM)。该算法充分考虑到派系对节点度的要求,即k-派系里的节点的度至少为k-1,同时把识别k-派系转化为(k-1)-派系,通过递归的方式来实现从小派系到大派系的识别过程。与CPM算法相比,该算法减小了网络上识别社团的搜索空间,提高了效率。 (4)针对不同物种间PPI网络功能模块的保守性,提出一种基于模块比对的方法来识别物种间的保守功能模块。与传统的网络比对方法相比,模块比对先利用聚类算法把PPI网络进行模块化分解以此来降低问题的复杂度,然后通过不同物种蛋白质间的序列相似性,建立起不同物种模块间的映射关系,从而达到识别保守模块的目的。该算法识别出来的保守模块在功能注释上具有很高的一致性,且从MCL算法分解的模块中识别出来的保守模块优于其它算法。但是,由于对网络进行了分解,破坏了整个网络结构,导致有些保守模块难以识别。 (5)导致相似疾病的基因其蛋白质产物会在PPI网络中表现出很紧密的交互性,这也可近似为模块性。针对这一特性,提出一种基于聚类分析的PPI网络中疾病相关模块的预测方法。通过一种集成多个生物证据的概率化模型来刻画疾病相关模块,且得分越高与疾病的关联性越大。结果表明CPM算法分解的模块做为候选的疾病相关模块优于MCL算法与MCODE算法,同时还发现大多数疾病相关模块都由Tissue-Specific Genes组成,且只在少部分人类组织(Human Tissues)共表达(Co-Expressed),少数疾病相关模块由House Keeping Genes (Maintenance Genes)组成,且在大部分人类组织共表达。 本文研究网络模块性分析的聚类算法及其在真实网络中的应用,特别是PPI网络中功能模块的识别以及疾病相关模块的预测。此外对于其它具有相似结构的复杂网络本文所讨论的算法也具有适用性。
【学位授予单位】:西安电子科技大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:N941.4

【引证文献】
中国期刊全文数据库 前2条
1 申玉发;张晓昱;赵立强;;密度K均值聚类算法及在复杂网络分析中的应用[J];河北科技师范学院学报;2013年04期
2 刘中明;马占鑫;林国龙;;基于聚类分析的检验检疫流程问题研究[J];中国商贸;2012年30期
中国硕士学位论文全文数据库 前2条
1 任巍英;基于属性扩展图的K-means聚类算法的研究[D];中北大学;2012年
2 吴爽;基于群智能机理的PPI网络功能模块聚类[D];陕西师范大学;2012年
【参考文献】
中国期刊全文数据库 前7条
1 解(亻刍);汪小帆;;复杂网络中的社团结构分析算法研究综述[J];复杂系统与复杂性科学;2005年03期
2 杨博;刘大有;金弟;马海宾;;复杂网络聚类方法[J];软件学报;2009年01期
3 魏秋红;王红;;实际网络的复杂特征分析[J];信息技术与信息化;2009年01期
4 刘中扬;李栋;朱云平;贺福初;;蛋白质相互作用网络进化分析研究进展[J];生物化学与生物物理进展;2009年01期
5 关薇;王建;贺福初;;大规模蛋白质相互作用研究方法进展[J];生命科学;2006年05期
6 余鑫煜;许正平;;蛋白质相互作用数据库及其应用[J];中国生物化学与分子生物学报;2008年03期
7 陈谋通;刘建军;;蛋白质相互作用的研究方法[J];生物技术通报;2009年01期
【共引文献】
中国期刊全文数据库 前10条
1 李东生;高明伦;;高密度集成与单芯片多核系统及其研究进展[J];半导体技术;2012年02期
2 武森;魏桂英;白尘;张桂琼;;分类属性高维数据基于集合差异度的聚类算法[J];北京科技大学学报;2010年08期
3 杨晓耘;王敬敬;唐勃峰;;复杂网络视角下的产业网络研究[J];北京科技大学学报(社会科学版);2010年03期
4 裴智勇;任松叶;蔡禄;;基于二级结构预测蛋白质复合体亚基相互作用[J];内蒙古科技大学学报;2010年01期
5 ;Research on Community Structure in Bus Transport Networks[J];Communications in Theoretical Physics;2009年12期
6 荣波;夏正友;;基于聚类的BBS成员交互网络特性研究[J];重庆科技学院学报(自然科学版);2009年06期
7 周正履;;关于英语第二课堂建设的研究与实践[J];大家;2012年05期
8 徐兴兴;常文军;翟羽佳;林丽萍;刘小康;马立业;张宏伟;曹广文;;PPP4R1基因与肿瘤相关性的生物信息学预测及在胃癌组织中的初步验证[J];第二军医大学学报;2009年03期
9 赵金利;张群华;余贻鑫;贾宏杰;杨锦;;输电网网架结构的谱聚类分析算法[J];电力系统及其自动化学报;2009年04期
10 李翔;李仕强;赵青虎;;基于边聚类方法的复杂网络社团挖掘研究[J];电脑知识与技术;2012年10期
中国重要会议论文全文数据库 前3条
1 ;The Application of Fuzzy Clustering in the Analysis of Community Structure[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 方锦清;汪小帆;郑志刚;;非线性网络的动力学复杂性研究的进展概况[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
3 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
2 王艳艳;功能化生物传感界面的构建及其在生物分析中的应用[D];南开大学;2010年
3 王娟;大规模网络安全态势感知关键技术研究[D];电子科技大学;2010年
4 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
5 罗兵;甘蓝SRK-SCR相互作用研究及作用强度与酵母生长关系模型的构建[D];西南大学;2011年
6 程发峰;精制清开灵注射液对脑缺血的治疗作用及对兴奋性毒性级联损伤的调控机制[D];北京中医药大学;2011年
7 冯铁男;基于小波的蛋白质相互作用网络的研究[D];上海大学;2011年
8 李伟;复杂网络特征结构的挖掘方法研究[D];南京理工大学;2010年
9 彭佳扬;代谢网络中功能模块挖掘和进化分析研究[D];中南大学;2011年
10 邓小龙;基于复杂网络分析的新一代电信CRM关键技术研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 张敏;猪圆环病毒2型感染猪肺泡巨噬细胞的蛋白质组学研究[D];华中农业大学;2010年
2 周斌;复杂网络的社团结构挖掘及应用研究[D];广西师范学院;2010年
3 郑建华;激活蛋白PeaT1在烟草细胞膜上的结合位点及其特性[D];新疆农业大学;2010年
4 谢凯;基于复杂网络的我国通信行业创新能力研究[D];武汉理工大学;2010年
5 郭燕红;BL0033与BL0034在长双歧杆菌果糖ABC转运系统中功能的研究[D];江南大学;2010年
6 李亚杰;基于复杂网络理论的产业网络研究[D];浙江工商大学;2011年
7 王蓓金;蛋白质网络模块分解的密度聚类算法研究[D];西安电子科技大学;2010年
8 王延鹏;复杂网络重叠社区发现算法研究[D];太原理工大学;2011年
9 张景阳;基于局部介数的复杂网络社区动态演化研究[D];太原理工大学;2011年
10 李大伟;大规模路网下中心式路径优化方法研究[D];吉林大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 雷秀娟;黄旭;吴爽;郭玲;;基于连接强度的PPI网络蚁群优化聚类算法[J];电子学报;2012年04期
2 李强;何衍;蒋静坪;;一种基于随机游动的聚类算法[J];电子与信息学报;2009年03期
3 李晓佳;张鹏;狄增如;樊瑛;;复杂网络中的社团结构[J];复杂系统与复杂性科学;2008年03期
4 王伟东,芦金婵,张讲社;基于视觉原理的密度聚类算法[J];工程数学学报;2005年02期
5 骆志刚;丁凡;蒋晓舟;石金龙;;复杂网络社团发现算法研究新进展[J];国防科技大学学报;2011年01期
6 吴超;钟一文;;蛋白质功能预测的蚁群优化算法[J];广西师范大学学报(自然科学版);2011年03期
7 刘白;周永权;;一种基于人工鱼群的混合聚类算法[J];计算机工程与应用;2008年18期
8 周世兵;徐振源;唐旭清;;新的K-均值算法最佳聚类数确定方法[J];计算机工程与应用;2010年16期
9 周雅兰;;细菌觅食优化算法的研究与应用[J];计算机工程与应用;2010年20期
10 曲良东;何登旭;;一种混沌人工鱼群优化算法[J];计算机工程与应用;2010年22期
中国博士学位论文全文数据库 前5条
1 尤著宏;基于图和复杂网络理论的蛋白质相互作用数据分析与应用研究[D];中国科学技术大学;2010年
2 钟一文;智能优化方法及其应用研究[D];浙江大学;2005年
3 王俊伟;粒子群优化算法的改进及应用[D];东北大学;2006年
4 李敏;蛋白质网络中复合物和功能模块挖掘算法研究[D];中南大学;2008年
5 倪青山;蛋白质相互作用与功能预测方法研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 杨建红;基于密度的聚类算法研究[D];长春工业大学;2010年
2 李亚飞;复杂网络中的社团结构检测算法研究[D];北京交通大学;2011年
3 刘彬彬;大规模蛋白质相互作用网络复合物挖掘算法研究[D];中南大学;2011年
4 刘金洋;粒子群优化算法的研究与改进[D];哈尔滨工业大学;2006年
5 郑晓鸣;人工鱼群算法的改进及应用[D];上海海事大学;2006年
6 李延恩;蛋白质相互作用网络的模块结构辨识[D];华中科技大学;2006年
7 莫春玲;复杂网络中聚类方法及社团结构的研究[D];武汉理工大学;2007年
8 彭利红;基于蛋白质相互作用网络的聚类和稀疏点检测算法研究[D];湖南大学;2008年
9 郭春艳;基于连接度的图聚类方法研究[D];山西大学;2008年
10 刘昊;基于聚类算法和相互作用网络的蛋白质功能预测研究[D];湖南大学;2009年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 宋志平;基于BPR理论的出入境货物检验检疫通关流程优化研究[D];厦门大学;2013年
【二级参考文献】
中国期刊全文数据库 前1条
1 石铁流,李亦学;系统生物学的现状与展望[J];中国科学基金;2005年05期
中国博士学位论文全文数据库 前1条
1 李勇;复杂网络理论与应用研究[D];华南理工大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 赵伟丽;张志国;;蚁群聚类算法的改进和实现[J];科技信息(学术研究);2008年02期
2 张天伍;李卫平;;一种基于密度的引力聚类算法[J];河南科学;2008年11期
3 梅娟;何胜;李炜疆;;基于图聚类的蛋白质相互作用网络功能模块探测[J];食品与生物技术学报;2011年01期
4 王圆妹;;一种改进的K-均值聚类算法的研究[J];长江大学学报(自科版)医学卷;2006年10期
5 俞辉;裴振奎;陈继东;;一种改进的蚁群聚类算法[J];郑州大学学报(理学版);2010年03期
6 周峰;陈基漓;陈欢;;基于高斯核的KSOFM聚类算法研究[J];大众科技;2011年02期
7 徐鸽;陈江瑞;;聚类分析在客户关系管理中的应用研究[J];企业技术开发;2008年01期
8 韩晓峰;;基于自回归的高斯混合模型[J];科技风;2009年23期
9 焦誉;赖建章;柯佳;;一种基于密度的网格动态聚类算法的研究[J];安徽大学学报(自然科学版);2007年01期
10 王路漫;;FCM聚类算法在数字图书馆中的应用研究[J];内蒙古大学学报(自然科学版);2010年04期
中国重要会议论文全文数据库 前10条
1 杨柳;钟诚;陆向艳;;基于P2P网络的分布式聚类算法研究分析[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
2 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 史金成;胡学钢;;基于约束的数据流聚类研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
5 宣照国;刘建国;党延忠;;基于公共邻居的一类复杂网络快速聚类算法[A];2006全国复杂网络学术会议论文集[C];2006年
6 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
7 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
8 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
9 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
10 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
中国重要报纸全文数据库 前10条
1 新疆 赵作清;好用的三端可调稳压模块[N];电子报;2003年
2 许同和 徐德池;C4系统简介[N];解放军报;2005年
3 西安协同数码股份有限公司 张敬波;甩掉流程变更的麻烦[N];计算机世界;2003年
4 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
5 ;模块化路由器面面观[N];科技日报;2000年
6 ;电信核心网构建之法[N];网络世界;2004年
7 熊哲宏;儿童发展的先天后天相互作用的动力论[N];中华读书报;2002年
8 记者 王巧然;法国ECA HYTEC公司推出新型电力驱动深海海下作业车[N];中国石油报;2006年
9 ;视频数据中挖“宝”[N];计算机世界;2002年
10 刘然;运营商如何构建电信级的核心网络?[N];中国经营报;2004年
中国博士学位论文全文数据库 前10条
1 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
2 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
3 冀进朝;针对多维混合属性数据的聚类算法研究[D];吉林大学;2013年
4 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
5 高若阳;基于知识观的组织模块性与企业适应性研究[D];浙江大学;2010年
6 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
7 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
8 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
9 唐东明;聚类分析及其应用研究[D];电子科技大学;2010年
10 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 李慧慧;基于GIS的空间聚类算法的研究与应用[D];贵州大学;2008年
2 刘赏;结合密度思想的蚂蚁聚类算法[D];河北工业大学;2003年
3 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
4 徐勇;分析型CRM中聚类算法的研究[D];兰州理工大学;2010年
5 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
6 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
7 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
8 庄怡雯;基于聚类算法的Web日志挖掘应用研究[D];东华大学;2011年
9 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
10 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026