基于聚类的复杂网络中社团发现的算法
【摘要】:复杂网络是一种对复杂系统进行研究的模型和工具。随着学术界越来越多地研究复杂网络,人们提炼出了不少重要性质,其中社团结构是复杂网络是最重要的拓扑性质。如果能发现复杂网络中的社团结构,对分析复杂网络的拓扑结构、功能和隐含模式等具有重要意义,并且可以预测复杂网络的各种行为,在万维网、社会网和生物网等中都有广泛的应用。本文先是对复杂网络中的社团发现在国内外的研究成果进行了阐述,分析研究了复杂网络的相关理论,以及对如今的社团发现算法的优点和缺点进行了分析,针对现存社区发现算法中存在的划分效率低、需要先验条件、不适用于大规模网络等问题,提出了一种基于MVV方法的谱算法以提高社团发现的准确率和执行效率。首先,本文提出了一种把网络中的结点转化成向量的方法—MVV方法,通过这一方法,可以把网络中的结点转换为适合数据挖掘中聚类算法的数据结构;然后在分析比对不同的相似性度量方法对聚类算法性能的影响后,提出了基于欧式距离的相异性指数;针对层次聚类算法由于噪音的影响无法适用于大规模网络的缺点,提出结合谱聚类和层次聚类,先由谱聚类对向量降维从而提高算法的执行效率和降低噪音的影响,再以相异性指数为基础进行层次聚类。本文利用Matlab工具进行数据处理,对基于MVV的谱方法从准确率、模块度、执行时间和大规模网络四个方面进行实验验证。实验结果表明该算法不仅能保障真实网络和生成网络中社团发现的准确性,而且较之传统的社团发现算法提高了计算效率,而且适用于规模较大的网络。最后本文分析了社团发现算法进一步研究的方向。