收藏本站
《复旦大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于图挖掘的网络社团结构发现

魏芳  
【摘要】: 现实世界的网络里自然地包含了很多社团结构,它们已经成为网络系统中一个重要的统计特征。例如,在社会网络中,它们可能代表着一组俱乐部成员;生物网络里,或许是一组功能相关的基因组;在语意网络中,它们是一些与某个主题相关的网页。通常来讲,社团结构是一些联系紧密的实体,结构内部节点之间的联系相对网络中其它节点更紧密。如何高效地挖掘出这些结构对理解和分析网络结构来说是一个很重要的问题。 尽管在网络社团的发现方面已经取得不少研究成果,但仍然存在许多问题有待解决。比如,有些算法的效率不是很高,社团结构的度量机制不够完善;很少有工作去关注重叠的社团结构,虽然重叠的结构在现实的网络中更普遍存在,也更能反映出真实世界的本质。针对这些问题,本文借助一些经典的算法来产生社团结构的种子,然后以拓展种子的方式来挖掘网络中重叠和非重叠的社团结构。本文的主要贡献如下: 1.结合多层次策略,文中运用经典的图谱划分方法产生了种子集合,并对种子的特征进行了分析。多层次策略使得算法在计算最粗糙图的Fiedler向量时具有很好的划分速度;谱平分方法帮助算法过程找到很好的图划分线索。这些种子集合抓住了社团结构的主体,反映出了目标社团的特征,具有很好的性能。 在真实的网络数据上,文中也对种子选取的合理性做出了验证。 2.运用种子拓展的方式提出了一种新颖的社团识别算法。该算法基于模块函数和节点的传递概率。模块函数是由Newman和Cirvan来定义的,它已经成为度量社团结构的一种主流标准。算法用它的改变值来评估新扩展节点对当前种子集合的贡献。传递概率在算法中被用来推断相邻节点之间的联系,反映扩展到新节点的权重。传递概率的源头是种子集合中节点的初始概率(初始权重)。新节点得到的概率决定了计算节点贡献值的次序,贡献值又决定了节点是否具有进一步扩展的机会。第4章对算法过程做出了详细的描述,同时也对扩展过程中节点的删除操作和扩展步上逃逸的概率做出了分析。 3.对网络中普遍存在的而又很少被关注的重叠社团结构,文中提出一种识别算法。对解决重叠问题,它开辟了一条新的途径。该算法仍然基于种子扩展。在得到种子集合之后,算法结合随机行走技术给出了一种合理的扩展过程,它用时间步来刻化。在扩展的每个时间步,算法首先计算出所有标准化后的节点概率。按照概率值的降序,所有的节点依次被扫描。然后,确定哪些节点在接下来的时间步里作进一步的扩展。通过节点扫描,算法还要对新扩展的节点作出是否为当前的种子集合贡献者的判断。这些判断主要用于寻找候选社团在当前时间步最优的结构。运用贡献节点的性质,文中给出了一些定理。基于性质定理,一些无用的扩展节点在寻找候选社团的最优结构时可以被安全地删除。扩展过程执行上述步骤直到社团结构之间的重叠率超过了用户的忍受范围或者到达了随机扩展的收敛时间。 第5章不仅介绍了算法步骤,也对扩展过程给出了理论分析。分析表明,提出的方法使得候选社团在每个时间步上都能找到最优的结构,基于懒惰随机行走的整个扩展过程也能给种子集合带来好的扩展结构。 4.在六个网络数据集上,对上述提出的算法作出了验证。数据集来自真实的网络,规模大小不等,内容涉及多个领域。在实验分析上,文中从多个角度运用多种机制来评估算法。评估内容包括种子选取方式上的对比,算法与相关工作的比较以及时间分析等。对重叠的社团结构,还给出了在著名的网络里发现的实例。实验结果表明文中提出的方法具有一定的优越性,同时也证明了重叠方式对识别完善的社团结构是非常重要的,让大家认识到重叠社团在真实网络中的研究意义。 综上所述,本文针对网络中的社团发现问题提出了几种新算法。这些算法采用了种子扩展的方式,扩展过程基于随机行走技术,扩展结构选用了模块函数来度量。文中用理论分析和大量的实验验证了这些算法。结果表明提出的方法能识别出结构完善的社团结构,具有很好的性能。
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:N941.4

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前4条
1 刘微;复杂网络中社团结构的发现[D];辽宁师范大学;2011年
2 彭玲;基于主题及核心人物的邮件网络社区发现研究[D];苏州大学;2010年
3 许冲冲;基于偶图分解的电压控制区域划分[D];华北电力大学;2012年
4 徐贺贺;图聚类算法及其在社交网络中的应用[D];安徽工程大学;2013年
【共引文献】
中国期刊全文数据库 前10条
1 宋兵;;基于复杂网络的农作物细菌性病害传播模型初探[J];安徽农业科学;2011年34期
2 魏娟;宋福庆;;两种全局同步稳定性方法的比较与应用[J];安阳师范学院学报;2011年05期
3 黄树林;鞠颂东;董军;;企业集团网络化物流模式的结构分析[J];北京交通大学学报(社会科学版);2011年01期
4 武志昊;林友芳;田盛丰;唐锐;;高度重叠社区的社区合并优化算法[J];北京交通大学学报;2011年03期
5 尹向敏;李元左;罗小明;;陆军武器装备综合集成系统复杂性研究[J];兵工自动化;2007年10期
6 邱原;邢焕革;;基于复杂理论的作战网络关键边评估方法[J];兵工自动化;2011年08期
7 马睿;朱建冲;杨美玲;;基于改进聚类生存度的军事通信网可靠性分析[J];兵工自动化;2012年06期
8 徐玉国;邱静;刘冠军;;基于复杂网络的装备维修保障协同效能优化设计[J];兵工学报;2012年02期
9 徐玉国;邱静;刘冠军;;基于多元加权网络的装备维修保障组织结构动态演化模型[J];兵工学报;2012年04期
10 程连元;杨柳青;柳应华;宗刚;;面向市政管理的不良信息传播仿真模型[J];北京工业大学学报;2011年04期
中国重要会议论文全文数据库 前10条
1 陈树文;高琼;;网络结构视角下中关村产业集群创新驱动困境与建议[A];创新驱动与首都“十二五”发展——2011首都论坛文集[C];2011年
2 耿志勇;;具有静态非线性互联结构的分布式异构系统的稳定性[A];第二十六届中国控制会议论文集[C];2007年
3 李鑫滨;王腊梅;刘仙;;基于动态复杂网络的Van der pol振子同步[A];第二十九届中国控制会议论文集[C];2010年
4 李立;;BA无标度网络中混沌动力系统的同步分析及控制[A];第二十九届中国控制会议论文集[C];2010年
5 张跃;蒋国平;;一类混沌复杂动态网络不稳定平衡点的牵制控制[A];中国自动化学会控制理论专业委员会A卷[C];2011年
6 郑新奇;苏艳军;杨光;王淑晴;;城市道路网络复杂性的研究方法——空间句法与复杂网络模型的集成分析[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
7 《基于学术交流的技术创新人才培养研究》课题组;陈雄辉;;基于学术交流的技术创新人才培养研究[A];学术交流质量与科技研发创新研究[C];2009年
8 王建功;李平辉;谭欢;;B-A模型的改进模型[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(下册)[C];2008年
9 李小叶;王红蕾;;城市公共交通网络的级联失效研究[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
10 李耀华;姚洪兴;;股市网络的稳定性研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 杜文博;面向航空交通系统的复杂网络与网络动力学研究[D];中国科学技术大学;2010年
2 籍艳;几类时滞系统的稳定与同步[D];江南大学;2010年
3 徐旭林;社会群体行为建模及其动力学分析[D];南开大学;2010年
4 杨树忠;复杂网络中的社团检测问题研究[D];北京交通大学;2009年
5 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
6 张建辉;节点势能导向多下一跳路由协议研究与性能评价[D];解放军信息工程大学;2009年
7 高磊;P2P工作流系统中的资源搜索及负载均衡优化研究[D];山东大学;2010年
8 张泽华;云计算联盟建模及实现的关键技术研究[D];云南大学;2010年
9 沈波;基于不完全测量信息的非线性随机系统的滤波与控制[D];东华大学;2011年
10 王耀;随机复杂动态网络的同步与稳定性分析[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 苏延森;刺激下拟南芥基因逻辑网络构建与分析[D];山东科技大学;2010年
2 李二艳;刺激下拟南芥基因相关网络构建与分析[D];山东科技大学;2010年
3 周斌;复杂网络的社团结构挖掘及应用研究[D];广西师范学院;2010年
4 高萌;复杂神经元网络的同步问题研究[D];哈尔滨工程大学;2010年
5 李玥亭;互联网社区核及完整社区提取策略[D];大连理工大学;2010年
6 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
7 孔健;基于半监督学习的社团划分算法研究[D];辽宁师范大学;2010年
8 贾琳;基于复杂网络的海洋排污权配置及其交易机制研究[D];中国海洋大学;2010年
9 王鹏;拓扑结构对Hindmarsh-Rose神经元放电模式调控作用的理论研究[D];安徽师范大学;2010年
10 张胜虎;基于复杂网络的南昌市公交网络优化研究[D];南昌大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王立敏;高学东;武森;;基于最小社团链接度增量的社团结构挖掘算法[J];北京科技大学学报;2009年01期
2 范磊,陈珩;二次电压控制研究(二)[J];电力系统自动化;2000年12期
3 刘大鹏,唐国庆,陈珩;基于Tabu搜索的电压控制分区[J];电力系统自动化;2002年06期
4 郭庆来,孙宏斌,张伯明,吴文传;基于无功源控制空间聚类分析的无功电压分区[J];电力系统自动化;2005年10期
5 郭庆来;孙宏斌;张伯明;吴文传;李钦;;协调二级电压控制的研究[J];电力系统自动化;2005年23期
6 熊虎岗;程浩忠;孔涛;;基于免疫—中心点聚类算法的无功电压控制分区[J];电力系统自动化;2007年02期
7 冯光明;陆超;黄志刚;韩英铎;余贻鑫;;基于雅可比矩阵的电压控制区域划分的改进[J];电力系统自动化;2007年12期
8 赵晋泉;刘傅成;邓勇;李可文;方朝雄;黄文英;;基于映射分区的无功电压控制分区算法[J];电力系统自动化;2010年07期
9 方鸽飞;刘君华;吕岩岩;;基于树形分布的电压控制分区[J];电力系统及其自动化学报;2007年01期
10 倪向萍;阮前途;梅生伟;何光宇;;基于复杂网络理论的无功分区算法及其在上海电网中的应用[J];电网技术;2007年09期
中国硕士学位论文全文数据库 前4条
1 黄伟;基于电压控制区的主导节点电压校正方法[D];河海大学;2004年
2 吕岩岩;基于分区控制的电力系统电压稳定性研究[D];浙江大学;2006年
3 张晓冬;电子邮件的社区挖掘技术研究[D];国防科学技术大学;2007年
4 陈静;基于区域平衡的电力系统无功/电压管理[D];大连理工大学;2008年
【二级引证文献】
中国硕士学位论文全文数据库 前3条
1 张茜;电子邮件网络中的社团挖掘研究[D];华东理工大学;2012年
2 顾胜贤;电子邮件社团核心聚类的社团划分算法研究[D];华东理工大学;2013年
3 张立晓;基于局部重心的网络重叠社团发现方法的研究[D];苏州大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 王洋;狄增如;樊瑛;;二分网络社团结构的比较性定义[J];复杂系统与复杂性科学;2009年04期
2 周斌;程慧;杨立志;裴国庆;;基于贪婪算法的符号网络中社团结构快速发现算法[J];大众科技;2009年12期
3 解;汪小帆;;复杂网络的一种快速局部社团划分算法[J];计算机仿真;2007年11期
4 王立敏;高学东;宫雨;马红权;;基于相对密度的社团结构探测算法[J];计算机工程;2009年01期
5 丁德武;陆克中;须文波;吴璞;黄海生;;基于SAA的苏云金杆菌代谢网络功能模块[J];计算机工程;2010年13期
6 刘晋霞;曾建潮;薛耀文;;用遗传算法优化模块密度探测社团结构[J];解放军理工大学学报(自然科学版);2011年03期
7 李晓佳;张鹏;狄增如;樊瑛;;复杂网络中的社团结构[J];复杂系统与复杂性科学;2008年03期
8 刘亚冰;汪小帆;;基于随机重连的复杂网络社团结构特性分析[J];微型电脑应用;2010年11期
9 韩华;王娟;王慧;;改进的CNM算法对加权网络社团结构的划分[J];计算机工程与应用;2010年35期
10 刘晋霞;曾建潮;薛耀文;;复杂网络强社团结构探测[J];小型微型计算机系统;2011年04期
中国重要会议论文全文数据库 前4条
1 高忠科;金宁德;;基于复杂网络社团结构的倾斜油水两相流流型辨识[A];第十二届全国非线性振动暨第九届全国非线性动力学和运动稳定性学术会议论文集[C];2009年
2 李晓佳;张鹏;狄增如;樊瑛;;复杂网络中的社团结构[A];第四届全国网络科学学术论坛暨研究生暑期学校论文集[C];2008年
3 李继新;;复杂网络社团结构算法的实例分析[A];2009中国控制与决策会议论文集(3)[C];2009年
4 樊瑛;李梦辉;张鹏;吴金闪;狄增如;;权重对网络结构和性质的影响——社团结构中权重的作用[A];2006全国复杂网络学术会议论文集[C];2006年
中国博士学位论文全文数据库 前6条
1 邬盈盈;基于V稳定性理论的复杂网络稳定性分析与牵制控制方法研究[D];浙江大学;2010年
2 王波;基于派系的复杂网络及其在公交网络上的应用研究[D];浙江工业大学;2009年
3 谢辉;基于复杂网络的若干动态机制研究[D];西安电子科技大学;2013年
4 赖大荣;复杂网络社团结构分析方法研究[D];上海交通大学;2011年
5 郭龙;复杂网络上自组织临界现象及Opinion演化动力学研究[D];华中师范大学;2010年
6 宋青;大规模网络最短路径的分层优化算法研究[D];上海交通大学;2012年
中国硕士学位论文全文数据库 前10条
1 董蕴源;基于谱方法的蛋白质相互作用网络分析[D];国防科学技术大学;2007年
2 庞传军;基于聚类的复杂网络中社团发现算法的研究[D];青岛大学;2009年
3 范彦静;基于社团结构的知识网建模与分析[D];山东师范大学;2009年
4 马朝阳;基于SNA的网络核心及社团结构挖掘研究[D];大连交通大学;2010年
5 戴存礼;复杂网络上动力学系统的同步行为研究[D];南京航空航天大学;2008年
6 赵君霞;复杂网络在中医临床知识发现中的应用研究[D];北京交通大学;2009年
7 朱振龙;内存数据库装载和交换策略研究[D];湖南大学;2009年
8 莫春玲;复杂网络中聚类方法及社团结构的研究[D];武汉理工大学;2007年
9 项炬;复杂网络上的社团结构探测研究[D];湘潭大学;2008年
10 鲍鲜鲲;基于复杂网络的作战同步建模与分析[D];国防科学技术大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026