基于复杂网络结构特征的社团检测算法研究
【摘要】:随着信息技术的飞速发展,互联网已经逐渐融入人们的日常生活当中。在此背景下,出现了大量的复杂网络。社团结构是复杂网络的重要特征,研究复杂网络的社团结构能够帮助研究者更好地理解复杂网络的特征和功能。论文详细介绍了复杂网络的基本概念、网络模型以及社团检测的几类常用算法。在此基础之上,作者对不同类型的复杂网络的拓扑结构进行深入研究之后,挖掘其隐含的信息,并提出了两个改进的社团检测算法。(1)提出一个基于节点相似度的社团检测算法—AR-Cluster算法,用于检测节点具有属性特征的复杂网络社团结构。通过对IGC-CSM算法进行分析和研究之后,我们发现IGC-CSM算法在计算节点的结构相似度时,只考虑拓扑结构中节点的三种连接关系,却未深入分析网络拓扑中,这些节点内部的密切关系。为了能够检测结构紧密且属性特征相似的社团,AR-Cluster算法提出吸引度和推荐度两个概念,重新定义节点的结构相似度,然后采用结构相似度和属性相似度的协同策略,定义节点之间的相似度;最后使用K-Medoids算法进行聚类。实验结果表明,AR-Cluster算法对于节点具有属性特征的复杂网络,能够有效检测社团结构。(2)提出一个基于节点重要度的社团检测算法—NI-DF算法,用于检测一般复杂网络中的社团结构和重叠点。算法分为两个阶段:网络硬划分和重叠点检测。第一阶段,NI过程,首先基于网络结构特征提出节点重要度的计算方法,然后选择重要度最大的节点作为簇的中心节点,通过TROC算法的中心节点扩展方法,最终得到网络的硬划分。第二阶段,DF过程,在第一阶段得到的划分结果之上,提出区别函数用于检测重叠点。实验结果表明,NI-DF算法能够较好地检测社团和重叠点。AR-Cluster算法目前只研究节点属性数目相同的社团检测问题,未考虑属性不对称的情况。NI-DF算法检测重叠点过于粗糙,需要细化。