Louvain算法在社区挖掘中的研究与实现
【摘要】:日新月异的互联网、云计算等网络信息技术给人们的生活带来了翻天覆地的变化,人们已经逐渐踏入了大数据时代。呈指数级增长的海量数据不仅为新兴的互联网企业,更为传统行业带来了机遇与挑战。网络的复杂度与规模不仅考验着现有的IT架构,也为计算机的计算能力提出了严峻的挑战。在网络社交平台盛行的今天,各大社交网站每天都会产生上TB级别的数据。传统的单机运算难以满足海量大数据处理,随着分布式计算框架的发展,并行计算技术逐渐成熟,已经能够有效解决计算瓶颈,为海量大数据挖掘提供技术支持。从社会网络方面研究入手,社会网络的研究关键在于节点间的关系与社会属性。现实表明,真实的社会网络都呈现具有社区结构的特性,社区发现就是通过网络中节点间的连接关系挖掘社区结构的过程。Louvain算法是一种基于模块度优化的高效算法,除了时间上的优势,还能探测到层次的社区结构,不会遗漏一些小型的社区。在研究Louvain算法的基础上,针对算法耗时问题,提出了并行化的改进思想进一步对算法效率进行优化,同时保证算法的精度不变。分布式计算框架的发展推动了分布式计算的应用,但是社区发现算法在分布式计算方面的应用却很少。面对具有海量数据的大规模复杂社交网络,利用分布式计算框架能进一步提高算法的运行效率,社区发现算法与分布式计算框架的结合必是社区发现未来的研究热点。Spark分布式计算框架对社区发现算法这类需要大量迭代计算的算法有着很好的适应能力。将改进后的算法在Spark分布式平台上实现,进一步提高了运行效率。针对分布式计算中不同计算节点之间消息传递滞后产生的社区互换等问题,提出了连通图的方法加以改进。
|
|
|
|
1 |
程彩娟;“八后问题”的算法与程序设计[J];天津职业技术师范学院学报;1991年02期 |
2 |
葛磊;武芳;王鹏波;张冬林;;3维建筑综合中基于最小特征的面平移算法[J];测绘科学技术学报;2009年02期 |
3 |
骆雯,孙延明,陈振威,陈锦昌;判断点与封闭多边形相对关系的改进算法[J];机械;1999年03期 |
4 |
李林;卢显良;;一种基于切割映射的规则冲突消除算法[J];电子学报;2008年02期 |
5 |
刘巧玲;张红英;林茂松;;一种简单快速的图像去雾算法[J];计算机应用与软件;2013年07期 |
6 |
林亚平,杨小林;快速概率分析进化算法及其性能研究[J];电子学报;2001年02期 |
7 |
章郡锋;吴晓红;黄晓强;何小海;;基于暗原色先验去雾的改进算法[J];电视技术;2013年23期 |
8 |
杨铁军;靳婷;;一种动态整周模糊值求解算法及其仿真分析[J];系统工程与电子技术;2007年01期 |
9 |
周秀玲;郭平;陈宝维;王静;;几种计算超体积算法的比较研究[J];计算机工程;2011年03期 |
10 |
吴一戎,胡东辉,彭海良;Chirp Scaling SAR成象算法及其实现[J];电子科学学刊;1995年03期 |
11 |
王贵竹;一种产生单向分解值的算法[J];安徽大学学报(自然科学版);2001年03期 |
12 |
张鹏;刘弘;王爱霖;;基于人工蜂群算法的疏散运动仿真[J];计算机工程;2013年07期 |
13 |
高广尚;蒋泰;;ISO 18000-6 Type C中的防冲突机制分析[J];广西科学院学报;2008年04期 |
14 |
凌卫新,凌玲;关于图像色彩压缩的一种新聚类算法[J];计算机工程;1996年04期 |
15 |
孟玉明;张修如;刘玲霞;;一种基于主动复制的动态容错算法[J];计算机技术与发展;2007年12期 |
16 |
邵晓东,孙文焕,卫荣平,詹海生;有向环边界自动生成的算法研究[J];西安电子科技大学学报;1996年04期 |
17 |
王琢;鲍玉斌;;一种快速生成最小浓缩数据立方的算法[J];小型微型计算机系统;2005年12期 |
18 |
韩丽,唐棣;一个快速有效的直线反走样算法[J];小型微型计算机系统;2005年03期 |
19 |
罗可;张学茂;;一种高效的频集挖掘算法[J];长沙理工大学学报(自然科学版);2006年03期 |
20 |
龚斌;一种基于磨光的图像分色算法[J];计算机工程与应用;1996年06期 |
|