收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

含有协变量的混合隶属度随机块模型的社区发现

杨晓  
【摘要】:社区结构作为社交网络的重要特征之一,在宏观上可以帮助我们深入理解网络的拓扑特性和本质的同时,在微观上对探索网络中用户的行为特点和用户之间的逻辑关系有着重要的作用。因此,社区发现作为社交网络的一项重要研究吸引众多领域的科研人员从不同的角度进行研究,但目前社区发现的研究仍然有许多未能解决的问题,如社交网络的重叠社区发现问题、异质网络的社区发现问题和社区发现的应用等等。在社区发现领域,早期的社区发现方法主要集中在对不含协变量或其他信息的社交网络做非重叠社区发现,而混合隶属度随机块模型(Mixed Membership Stochastic Block Model,MMSB)可以对有向网络作重叠社区划分,同时可以获得各节点在各社区的隶属度情况。但是现有的MMSB模型只考虑了社交网络本身的连接信息,并未考虑节点的协变量信息,这会令模型的社区划分精度和应用受到限制。Roy et al.(2018)考虑了用带有节点协变量的随机块模型(Stochastic Model,SBM)来研究Facebook数据,但SBM模型不能用于重叠社区。基于以上,本文通过研究现有的社交网络社区发现方法,分析各自的优缺点,提出了基于混合隶属度随机块模型的含有协变量信息的重叠社区划分方法,主要完成了以下几方面的研究内容:1)在MMSB模型的基础上,提出了一种针对含有节点协变量信息网络的重叠社区划分模型。首先,通过建立生成模型来模拟观测网络的生成过程,根据估计的参数,即节点的混合隶属度,对社交网络进行社区划分。由于本模型的似然函数复杂度比较高,且参数之间并不是互相独立的,直接利用极大似然估计方法不方便进行估参,因此,本文运用变分期望最大(Variational Bayes expectation maximization,VBEM)算法做参数估计。我们将从数学角度说明了模型构建的合理性,并详细地推导了利用VBEM算法求解模型参数的迭代公式。2)众所周知,社交网络中的节点会含有很多协变量信息,如Facebook用户的年龄、性别、院校、职业、喜好、家乡等,有些协变量对于社区发现并没有很重要的作用。尤其是在社交网络中节点足够多时,筛选协变量可以在保证社区发现效果的前提下,大大降低模型的运行时间。本文筛选协变量采用的办法是The Least Absolute Shrinkage and Selection Operator(Lasso)法,该方法能够对变量进行筛选降低模型的复杂程度,本文还介绍了确定社区数目的方法。3)运用含有协变量的MMSB模型做数值模拟以此来评估本模型的性能。主要评估本模型在单一社区和重叠社区以及低、中、高不同的进出比率和平均度下构造的生成网络下的表现情况。评估模型所用的主要指标是标准化互信息和模块度。结果表明,含有协变量的MMSB模型在高平均度下生成的网络社区发现效果比较好。4)运用含有协变量的MMSB模型对Facebook数据做社区发现,进行实证分析,并通过可视化的方法显示社区划分结果。该实证表明本模型的似然函数可以收敛,通过构建邻接阵的热力图、展示节点的混合隶属度等展示模型的划分效果。最后,利用模块度方法,我们对含有协变量的MMSB模型和基础的MMSB模型以及含有协变量的SBM模型的社区发现效果进行量化比较。最终,我们发现,含有协变量的MMSB模型的社区划分效果要优于其他两个模型。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 陈津津;;基于供应链思维的存货削减模型研究及应用[J];铁路采购与物流;2020年01期
2 王建成;蔡延光;;基于多模型融合的工业工件剩余寿命预测[J];自动化与信息工程;2020年01期
3 龙正祥;;基于模型构建 引领思维发展[J];高中数学教与学;2018年13期
4 谢迪;蒋欣欣;;基于离散时间风险模型下的亏损破产概率的研究[J];甘肃科学学报;2017年02期
5 刘丽萍;;高维稀疏对角GARCH模型的估计及应用[J];数学的实践与认识;2017年11期
6 韩宏禹;;信息系统成功模型在卫生领域的应用及扩展[J];信息系统工程;2016年05期
7 郑燕;;例谈化学模型的特征、作用与类型[J];中学教学参考;2020年11期
8 Javi Diesel;;什么是“做模型”[J];模型世界;2018年11期
9 ;广州文华模型[J];模型世界;2019年01期
10 ;《模型世界》火热预订[J];模型世界;2019年01期
11 ;模型世界征募志愿者啦![J];模型世界;2015年08期
12 周向林;;《模型·北京212》[J];山西文学;2015年08期
13 ;模型世界[J];模型世界;2014年04期
14 吴德英;;浅谈自制模型在生物教学中的优势[J];山东教育;2014年Z6期
15 黄从红;杨军;张文娟;;生态系统服务功能评估模型研究进展[J];生态学杂志;2013年12期
16 ;晚年做的最后一个模型,2000年以后[J];建筑创作;2013年Z2期
17 向红;孟新友;张小兵;;连续与离散互惠模型的持续生存[J];甘肃科学学报;2010年01期
18 戴亚娥;谭恒松;陈燕燕;;大学生选修课诚信模型的研究[J];福建电脑;2010年12期
19 孟彦菊;翟佳琪;;关于EC+IO联合模型的综述[J];统计研究;2008年09期
中国重要会议论文全文数据库 前10条
1 张永青;赵明清;;复合更新风险模型生存概率局部估计解[A];中国企业运筹学学术交流大会论文集[C];2008年
2 欧阳威;胡笑羽;胡竹菁;艾炎;沈友田;张盼盼;;推理判定标准对推理加工的影响:基于两种理论四种模型的比较[A];第二十一届全国心理学学术会议摘要集[C];2018年
3 杨文婧;王倩;;一种新的哑铃模型及其在平板收缩流中模拟计算[A];第十二届全国流变学学术会议论文集[C];2014年
4 戴锋;韩枫;叶春林;;基于偏尾分布的发展力模型及实证分析[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
5 王伟;;IT治理的主要内控模型比较研究[A];中国会计学会第八届全国会计信息化年会论文集[C];2009年
6 孟庆春;林峥;;关于宏观经济的一对对偶模型[A];2001年中国管理科学学术会议论文集[C];2001年
7 李泽慧;沈俊山;朱金霞;;一类风险模型的破产概率估计[A];2003中国现场统计研究会第十一届学术年会论文集(下)[C];2003年
8 杨玫;王丽丽;周海兵;张树道;;用浮阻力模型研究Richtmyer-Meshkov不稳定性诱导混合[A];中国力学大会-2015论文摘要集[C];2015年
9 祁国宁;顾新建;李仁旺;;大批量定制及其模型的研究[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年
10 高林;刘喜梅;;多模型中权值确定的新方法及其应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
中国博士学位论文全文数据库 前10条
1 欧阳林寒;模型不确定下的稳健参数设计研究[D];南京理工大学;2016年
2 刘展;基于广义比例优势模型的加速寿命试验统计分析与优化设计[D];西南财经大学;2016年
3 李钦;面向模型的组合理论研究[D];华东师范大学;2011年
4 尚文朋;加法与乘法风险模型的广义矩估计方法[D];华中科技大学;2017年
5 周伊佳;带有共享不确定参数的鲁棒优化模型[D];大连理工大学;2017年
6 梁璐;预测原发性青光眼发生风险的分类回归树及列线图模型的初步建立及评估[D];复旦大学;2012年
7 徐猛;N人雪堆博弈模型的第三种策略引入及其影响探究[D];浙江大学;2017年
8 李培志;支持向量机模型的优化及其应用研究[D];东北财经大学;2019年
9 李培志;支持向量机模型的优化及其应用研究[D];东北财经大学;2019年
10 吴增海;社交网络模型的研究[D];中国科学技术大学;2012年
中国硕士学位论文全文数据库 前10条
1 杨晓;含有协变量的混合隶属度随机块模型的社区发现[D];浙江财经大学;2019年
2 杨晓;含有协变量的混合隶属度随机块模型的社区发现[D];浙江财经大学;2019年
3 陈文婷;化学教师对模型的认识和应用研究[D];华东师范大学;2008年
4 于学伟;基于主题模型的网络舆情分析及其应用研究[D];厦门大学;2017年
5 夏志强;基于以旧换新的闭环供应链模型研究[D];厦门大学;2014年
6 何煦;权益资本成本估计模型的最优选择[D];西南财经大学;2008年
7 于倩倩;地理加权随机前沿模型的研究与应用[D];中央民族大学;2011年
8 姬君;基于“模型”方法的化学教学设计研究[D];天津师范大学;2010年
9 程东亚;多重延迟更新风险模型中的破产概率及局部破产概率[D];苏州大学;2005年
10 常东亚;基于上下文的主题模型[D];苏州大学;2017年
中国重要报纸全文数据库 前10条
1 徐瑾;模型思维,其实也是复杂思维[N];经济观察报;2020年
2 本报通讯员 李施璇;期待数字孪生模型开花结果[N];人民铁道;2019年
3 郑磊;迎接多样化现实与多模型思维时代[N];21世纪经济报道;2020年
4 渭南军分区 郑宏;多重视语言的“种子模型”[N];解放军报;2019年
5 孟苏;一个模型的力量[N];衢州日报;2018年
6 吴礼晖;小模型可获大财富[N];经理日报;2004年
7 赵倩;军事模型必须实现共享[N];解放军报;2005年
8 辛华 张宁;军事模型亦可“藏”[N];中国商报;2003年
9 记者 江瑜;大桥通车照片和模型成“网红”[N];南京日报;2019年
10 ;建立高效的思维格栅模型[N];上海证券报;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978