收藏本站
《燕山大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

大规模数据图上的影响力社区发现方法研究

陈健琦  
【摘要】:社区发现问题可应用到生物网络、交通网络、传染病防控网络以及社交网络中,用于发现有特定特征的、联系紧密的一组实体集。社区影响力是社区中对象集合在网络中重要性的客观度量。随着网络技术的飞速发展,实际应用中出现了规模较大的数据图。大图上存在的社区很多,但实际中用户只关心联系紧密、有影响力的社区。本文研究的是top-r影响力社区查询问题,用于从给定的无向图中返回前r个影响力最高的社区,具体内容如下。首先,在索引构建方面,提出以索引树的方式组织社区之间的关系,其中树中的每一个结点对应一个社区。为了快速构建索引树,首先计算原始图上的k核心的最大k值,并将所有度小于k的结点删除。然后,对每一个结点保存其在索引树中的父亲结点标志。在计算出一个索引树中的结点之后,设置其在树中的父亲结点。当图中所有结点处理完时,索引树构建完毕。和已有方法相比,减少了寻找索引结点之间关系的时间代价,提高了构建效率。其次,在社区查询方面,对top-r影响力社区进行了重新定义,用该社区结点的加权平均值作为社区影响力的衡量标准,避免了在新用户加入时使该社区的影响力骤然下降的情况,让求出的top-r个结果更加贴合实际。同时,提出新的top-r影响力社区查询算法,该算法基于新的索引结构,快速输出所有top-r个社区及其影响力。最后,在实验阶段,基于6个真实数据集和6个人工数据集,从构建索引的时间,查询的时间以及索引大小等方面进行了比较,实验结果验证了本文所提方法的高效性。
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O157.5

【相似文献】
中国期刊全文数据库 前1条
1 张滨生;利用MAPGIS快速制作点位数据图的一种方法[J];物探化探计算技术;2001年01期
中国重要报纸全文数据库 前2条
1 赵文郁;国家基础地信中心持续提供数据图件[N];中国测绘报;2014年
2 吴思;扫描仪的最新动向[N];中国包装报;2005年
中国硕士学位论文全文数据库 前6条
1 王建孟;基于数据社区的领域数据图信息发现算法研究[D];大连海事大学;2015年
2 陈健琦;大规模数据图上的影响力社区发现方法研究[D];燕山大学;2017年
3 郑石军;基于贝叶斯网络的数据图检索算法研究[D];大连海事大学;2013年
4 高延太;基于并行处理大数据图查询研究[D];华北电力大学(北京);2017年
5 贾少飞;油田油藏工程数据图件生成系统设计与实现[D];吉林大学;2009年
6 白同贺;基于频繁子图的图查询技术研究[D];东南大学;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026