收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于图挖掘的网络社团结构发现

魏芳  
【摘要】: 现实世界的网络里自然地包含了很多社团结构,它们已经成为网络系统中一个重要的统计特征。例如,在社会网络中,它们可能代表着一组俱乐部成员;生物网络里,或许是一组功能相关的基因组;在语意网络中,它们是一些与某个主题相关的网页。通常来讲,社团结构是一些联系紧密的实体,结构内部节点之间的联系相对网络中其它节点更紧密。如何高效地挖掘出这些结构对理解和分析网络结构来说是一个很重要的问题。 尽管在网络社团的发现方面已经取得不少研究成果,但仍然存在许多问题有待解决。比如,有些算法的效率不是很高,社团结构的度量机制不够完善;很少有工作去关注重叠的社团结构,虽然重叠的结构在现实的网络中更普遍存在,也更能反映出真实世界的本质。针对这些问题,本文借助一些经典的算法来产生社团结构的种子,然后以拓展种子的方式来挖掘网络中重叠和非重叠的社团结构。本文的主要贡献如下: 1.结合多层次策略,文中运用经典的图谱划分方法产生了种子集合,并对种子的特征进行了分析。多层次策略使得算法在计算最粗糙图的Fiedler向量时具有很好的划分速度;谱平分方法帮助算法过程找到很好的图划分线索。这些种子集合抓住了社团结构的主体,反映出了目标社团的特征,具有很好的性能。 在真实的网络数据上,文中也对种子选取的合理性做出了验证。 2.运用种子拓展的方式提出了一种新颖的社团识别算法。该算法基于模块函数和节点的传递概率。模块函数是由Newman和Cirvan来定义的,它已经成为度量社团结构的一种主流标准。算法用它的改变值来评估新扩展节点对当前种子集合的贡献。传递概率在算法中被用来推断相邻节点之间的联系,反映扩展到新节点的权重。传递概率的源头是种子集合中节点的初始概率(初始权重)。新节点得到的概率决定了计算节点贡献值的次序,贡献值又决定了节点是否具有进一步扩展的机会。第4章对算法过程做出了详细的描述,同时也对扩展过程中节点的删除操作和扩展步上逃逸的概率做出了分析。 3.对网络中普遍存在的而又很少被关注的重叠社团结构,文中提出一种识别算法。对解决重叠问题,它开辟了一条新的途径。该算法仍然基于种子扩展。在得到种子集合之后,算法结合随机行走技术给出了一种合理的扩展过程,它用时间步来刻化。在扩展的每个时间步,算法首先计算出所有标准化后的节点概率。按照概率值的降序,所有的节点依次被扫描。然后,确定哪些节点在接下来的时间步里作进一步的扩展。通过节点扫描,算法还要对新扩展的节点作出是否为当前的种子集合贡献者的判断。这些判断主要用于寻找候选社团在当前时间步最优的结构。运用贡献节点的性质,文中给出了一些定理。基于性质定理,一些无用的扩展节点在寻找候选社团的最优结构时可以被安全地删除。扩展过程执行上述步骤直到社团结构之间的重叠率超过了用户的忍受范围或者到达了随机扩展的收敛时间。 第5章不仅介绍了算法步骤,也对扩展过程给出了理论分析。分析表明,提出的方法使得候选社团在每个时间步上都能找到最优的结构,基于懒惰随机行走的整个扩展过程也能给种子集合带来好的扩展结构。 4.在六个网络数据集上,对上述提出的算法作出了验证。数据集来自真实的网络,规模大小不等,内容涉及多个领域。在实验分析上,文中从多个角度运用多种机制来评估算法。评估内容包括种子选取方式上的对比,算法与相关工作的比较以及时间分析等。对重叠的社团结构,还给出了在著名的网络里发现的实例。实验结果表明文中提出的方法具有一定的优越性,同时也证明了重叠方式对识别完善的社团结构是非常重要的,让大家认识到重叠社团在真实网络中的研究意义。 综上所述,本文针对网络中的社团发现问题提出了几种新算法。这些算法采用了种子扩展的方式,扩展过程基于随机行走技术,扩展结构选用了模块函数来度量。文中用理论分析和大量的实验验证了这些算法。结果表明提出的方法能识别出结构完善的社团结构,具有很好的性能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘鑫;;企业资源计划系统下会计业务流程的再造及其特点[J];黑龙江科技信息;2010年11期
2 刘平;;将网络变成人类第六感[J];科学大观园;2009年06期
3 蒋春曦,俞冠群,宣兴耕;安徽省地震信息网络数据动态备份措施的研究[J];地震地磁观测与研究;2005年03期
4 刘志辉;许捍卫;;基于Google Maps API和网络数据抓取技术的WebGIS开发[J];测绘通报;2009年03期
5 钟卫;浅谈网络数据的加密[J];甘肃科技;2005年04期
6 李菁;几种读网络上的实时数据库的方法[J];广西气象;1994年02期
7 钟卫;浅谈网络数据的加密[J];甘肃科技;2005年03期
8 衡闻琦;;企业网络数据备份探索[J];科技资讯;2011年30期
9 武松林;校园网──客户/服务器方式和分布式应用[J];云南民族学院学报(自然科学版);1995年02期
10 罗莎;朱威;王培源;邹彤;郭唐永;;网络数据流分析方法[J];大地测量与地球动力学;2011年S1期
11 阮莉;;英美科技研究与网络文化[J];科协论坛(下半月);2007年10期
12 陈绿苗;;基于数据挖掘技术的现代远程教育研究[J];中国科技信息;2008年07期
13 赵建勋;;基于WinPcap网络数据包捕获实现[J];西安文理学院学报(自然科学版);2011年04期
14 朱艳琴;蒋臻;;一种网络数据安全系统的设计[J];苏州大学学报(自然科学版);1993年01期
15 王高峡;沈轶;;网络的模块矩阵及其社团结构指标[J];物理学报;2010年02期
16 秦朝辉;;网络数据包到达速率的混沌特性分析及其短期预测[J];山西师范大学学报(自然科学版);2005年04期
17 张义民;;频域内振动传递路径的传递度排序[J];自然科学进展;2007年03期
18 陈德权;;基于GeoJSON的WFS实现方式[J];测绘科学技术学报;2011年01期
19 张俊洁;气象网络数据的日常维护[J];河南气象;2003年02期
20 郭建辉;冯杏芬;白工;黄晓波;;录井数据网络验收系统设计与应用[J];录井工程;2008年03期
中国重要会议论文全文数据库 前10条
1 陈同江;贾艳平;李岩峰;;邯钢棒一生产线连轧机电控系统的改造[A];冶金企业自动化、信息化与创新——全国冶金自动化信息网建网30周年论文集[C];2007年
2 蔡佳成;谷利泽;钮心忻;;Linux数据链路层网络通信驱动的实现[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
3 王平;施文灶;黄晞;程明传;;便携式网络数据分析仪的研究与设计[A];2008’“先进集成技术”院士论坛暨第二届仪表、自动化与先进集成技术大会论文集[C];2008年
4 邓伟;;电视台业务数字化解决方案[A];中国电影电视技术学会影视科技论文集[C];2002年
5 周荣根;许如山;孙翔;;运用工控网络数据分析设备工况 提高新膨丝线的经济运行水平[A];上海烟草系统2002年度学术论文选编[C];2002年
6 娄艳艳;;高速公路联网收费网络数据的安全性简介[A];湖北省公路学会——2004年机电工程研讨会论文集[C];2004年
7 盖立平;;网络数据动态交换技术的研究及其应用[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年
8 陈俊平;吴斌;胡小工;李浩军;;上海天文台陆态网络数据分析中心[A];第三届中国卫星导航学术年会电子文集——S08卫星导航模型与方法[C];2012年
9 杨斌;;应用辐照技术研制生产高性能环保型网络数据线缆技术初探[A];天津市核学会2005年学术交流会论文汇编[C];2005年
10 曲成义;;计算机网络数据安全系统[A];第五次全国计算机安全技术交流会论文集[C];1990年
中国博士学位论文全文数据库 前10条
1 魏芳;基于图挖掘的网络社团结构发现[D];复旦大学;2008年
2 赵俊美;基于对象—关系模型的空间数据建模研究[D];中国地质大学(北京);2007年
3 包铁;网络数据采集处理方法及形式化研究[D];吉林大学;2007年
4 王文奇;入侵检测与安全防御协同控制研究[D];西北工业大学;2006年
5 陈云芳;分布式入侵检测系统关键技术研究[D];苏州大学;2008年
6 张岳公;基于代理的对等分布式入侵检测系统研究[D];山东大学;2006年
7 张桂玲;基于软计算理论的入侵检测技术研究[D];天津大学;2006年
8 张博;基于IPv6环境的网络安全检测与Phishing防御研究[D];西北工业大学;2006年
9 邹连英;嵌入式TCP/IP以太网控制器芯片研究与设计[D];华中科技大学;2006年
10 郭建宏;林副产品配送优化辅助决策模型及GIS集成研究[D];北京林业大学;2008年
中国硕士学位论文全文数据库 前10条
1 余瑞星;固体火箭发动机网络信息管理系统[D];西北工业大学;2003年
2 彭祚鹏;基于协议分析的网络信息还原及挖掘[D];成都理工大学;2008年
3 胡学营;信息检索中语段形式用户需求的分析[D];上海交通大学;2008年
4 苏奕;人工神经网络数据融合方法研究与应用[D];浙江大学;2002年
5 陈平;医院网络数据的数据仓库建立方法及初步应用[D];中国人民解放军第四军医大学;2003年
6 王德栋;基于嵌入式Linux的网络数据包分析控制器[D];北方工业大学;2007年
7 程恩;基于机器学习的入侵检测系统研究[D];华中科技大学;2006年
8 罗彩君;Web社区结构挖掘的研究与应用[D];西北大学;2008年
9 张新权;一个基于应用的网络信息应急恢复系统的设计与实现[D];上海交通大学;2006年
10 王硕;网络敏感图像过滤中图像数据获取技术研究[D];吉林大学;2008年
中国重要报纸全文数据库 前10条
1 陶国建;普天打造网络数据产品[N];中国电子报;2000年
2 范范 编译;谁该拥有你的社交网络数据?[N];网络世界;2011年
3 张志刚;管好网络数据[N];中国计算机报;2001年
4 记者 孙进;谷歌街景只是“无意”作恶?[N];第一财经日报;2010年
5 ;网络数据 “备战”BPO[N];网络世界;2006年
6 刘其丕 李晓飞;环保型阻燃网络数据线缆在津推出[N];中国有色金属报;2005年
7 李立新 陈晓杰;双牌国税局网络数据6年无差错[N];中国税务报;2007年
8 陈京春;巨龙公司:全线网络数据亮相通信展[N];中国机电日报;2000年
9 本报记者 郭平;10GbE的部署正在逐步增长[N];计算机世界;2010年
10 本报记者 刘洪;IDC在中国的发展方向[N];通信产业报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978