收藏本站
《吉林大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

复杂网络社区发现若干问题的研究

平树秋  
【摘要】:现实世界中的许多系统都可表示成网络,如生物系统、社会系统和交通系统等。然而,这些网络往往因过于复杂而难于理解。复杂网络分析有助于人们认识和理解网络的内在机制,因而具有重要的研究意义。社区发现是复杂网络分析的重要内容。它有助于人们认识网络的组织结构和链接模式,进而指导实践,如传染病防控、舆情监控、交通规划和配电网资源优化配置等,因此,对社区发现的研究具有重要的理论意义和实用价值。社区发现引起了学者们的广泛关注,然而,如何进一步提高社区发现的精度和效率依然是一个挑战性难题。本文对社区发现进行了研究并提出了相应的算法。研究内容主要包括:基于符号随机块模型和精确完整数据综合似然(the exact integrated complete data likelihood,ICLex)的符号网络社区发现,基于统计推理的动态网络社区发现,基于统计模型的网络节点分类的批量模式主动学习,以及基于飞蛾烛火优化的社区发现。本文的具体工作和贡献如下:第一、针对符号网络社区发现问题,本文提出了一个基于统计推理和ICLex的符号网络社区发现方法SSBMI(Signed Stochastic Block Model and ICLex).据我们所知,这是首次利用ICLex解决符号网络社区发现问题的努力。首先,本文推导出基于符号网络随机块模型SSBM(Signed Stochastic Block Model)的ICLex;然后,本文利用一个贪婪搜索技术来优化ICLex;最终,将所发现的具有最高ICLex的社区结构作为结果返回。与2015年发表在AAAI上的基于统计推理的符号网络社区发现方法SSL相比,SSBMI不需要通过对模型空间的模型逐个进行参数估计并在估计结果中选优来实现模型选择,从而节省了大量的计算时间。SSBMI不需要用户事先掌握网络结构的先验知识,这不仅降低了用户的使用门槛,而且也使拟合主要由数据来驱动。在合成网络和真实网络数据上的实验结果表明,与SSL等几个有代表性的方法相比,SSBMI能够更精确地发现符号网络中的社区。同时,与SSL相比,SSBMI的效率更高。第二、针对动态网络社区发现问题,本文提出了一个基于统计推理的动态网络社区发现方法DSBMC(Dynamic Stochastic Block Model with Constraints).首先,本文提出了一个新的动态随机块模型。该模型使用转移概率建模节点社区分配的动态变化,并且在该模型中,所有节点共享同一个社区转移概率,所有社区内的节点对共享同一个链接概率,所有社区间的节点对共享同一个链接概率。其次,基于贝叶斯推理和吉布斯采样,本文给出了该模型的学习方法。在人工合成和真实数据上的实验表明,与几个有代表性的算法相比,DSBMC能获得更高的精度。第三、为了解决网络节点分类中单节点模式主动学习效率不高的问题,本文提出了一个基于统计模型的可用于同配或异配网络节点分类的批量模式主动学习方法BALN(Batch Active Learning for Networks).该方法采用互信息和随机游走思想选择用于标注标签的节点。BALN适用于同配或异配网络。与单节点模式主动学习不同,BALN一次可选择多个节点用于标注。同时,BALN仅使用网络拓扑作为输入数据,不需要事先知道网络中块(社区)的个数,也不需要对块连接模式作初始假设。在两个不同类型(同配和异配)的网络上,本文将BALN与基于单节点模式主动学习的Moore方法以及几个使用互信息和简单启发式的批量模式主动学习方法进行了实验比较,结果表明,在使用同样的查询节点数的情况下,BALN方法可使用明显少的查询次数获得和Moore方法大体相当的分类精度;在使用同样查询成本的前提下,与上述几个使用互信息和简单启发式的批量模式主动学习方法相比,BALN方法在精度上具有明显优势。第四、针对无符号网络社区发现问题,本文提出了一个基于飞蛾烛火优化的复杂网络社区发现方法MFOCD(Moth-Flame Optimization based Community Detection).该方法使用字符串编码重新设计飞蛾烛火优化的个体表示,使用单点交叉,变异与爬山算法思想相结合的方式来重新设计飞蛾围绕烛火的搜索,使得飞蛾烛火优化技术适合处理社区发现问题。在人工合成和真实数据集上的实验表明,与几个相关算法相比,MFOCD能获得更高的精度。
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:O157.5

免费申请
【相似文献】
中国期刊全文数据库 前10条
1 李雪;;数学统计模型在旅游业发展中的应用[J];旅游纵览(下半月);2019年02期
2 李宝瑜;;统计模型应用面临的挑战与转型[J];统计与信息论坛;2016年11期
3 李海东;;经历探究过程,构建统计模型——特级教师徐斌《平均数》教学赏析[J];教育研究与评论(小学教育教学);2016年12期
4 郑文波;叶鹰;;基于累加两水平统计模型的年降雨量预测[J];黄冈师范学院学报;2010年03期
5 刘殿国;陈守东;;幂整体模式累加多层统计模型的建立及应用[J];统计与决策;2009年05期
6 刘殿国;许芳;;幂随机系数累加多层统计模型的建立及其预测上的应用[J];系统工程;2008年11期
7 武开宏;刘迎龙;;适用于公众健康调查结果报告的统计模型标准[J];中华医学杂志;2006年11期
8 陆中道;双源统计模型对158A GeV Pb+Pb反应实验数据的分析[J];中国原子能科学研究院年报;2000年00期
9 吴中如;沈长松;阮焕祥;;论混凝土坝变形统计模型的因子选择[J];河海大学学报;1988年06期
10 李葵发;高能核-核碰撞横能分布的唯象分析[J];江汉石油学院学报;1989年01期
中国重要会议论文全文数据库 前10条
1 叶斯琪;黄思远;陈多宏;李红霞;徐伟嘉;谢敏;沈劲;汪宇;潘月云;嵇萍;;统计模型在城市空气质量预报中的应用[A];《环境工程》2018年全国学术年会论文集(中册)[C];2018年
2 刘晶晶;卫水爱;孙俊君;胡海云;邢修三;;生物材料的非平衡统计模型[A];中国力学学会学术大会'2005论文摘要集(上)[C];2005年
3 蒋丹宁;秦勇;刘文;刘义;;基于统计模型的哼唱旋律识别算法[A];第九届全国人机语音通讯学术会议论文集[C];2007年
4 杨展旗;李健;;智能化电量统计模型的设计与实现[A];2010电力行业信息化年会论文集[C];2010年
5 陈永胜;刘小明;任福田;张黔芳;;道路安全设计支持平台之统计模型的研究[A];第七次城市道路与交通工程学术会议论文集[C];2002年
6 彭吳忠谋;;训练用汉语语音资料之音素标示[A];第四届全国人机语音通讯学术会议(NCMMSC1996)论文集[C];1996年
7 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 胡振涛;刘先省;;基于“当前”统计模型的一种改进机动目标跟踪算法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
9 信飞;孙国武;陈伯民;;自回归统计模型在延伸期预报中的应用[A];第六届长三角气象科技论坛论文集[C];2009年
10 潘华志;耿则勋;郭和伟;马军;;基于多尺度灰度GAP统计模型的小波域图像边缘检测[A];第十三届全国图象图形学学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 赵纪东;地震分析的里程碑:物理模型再现统计模型结果[N];中国矿业报;2018年
2 葛新权 北京信息科技大学经济管理学院;经济统计模型的建模原则与创新[N];中国社会科学报;2010年
3 记者 李陈续  通讯员 杨晓萍;科学家建立非典空间统计模型[N];光明日报;2003年
4 李传金;设计新的统计模型[N];经济视点报;2006年
5 沈翀;空间统计模型有助非典流行病学研究[N];医药经济报;2003年
6 IBM大数据专家 James Kobielus 范范 编译;大数据需要不间断测试[N];网络世界;2014年
7 郭妍;应该重视基础学科教育[N];陕西日报;2007年
8 马扬;认识CRM避开几大误区[N];中国计算机报;2000年
9 罗峻;“报”“表”不再分离[N];中国计算机报;2004年
10 范范 编译;DevOps将数据科学提升至新水平[N];网络世界;2013年
中国博士学位论文全文数据库 前10条
1 平树秋;复杂网络社区发现若干问题的研究[D];吉林大学;2019年
2 刘殿国;累加方法的多层统计模型的建立及其应用研究[D];吉林大学;2005年
3 马继勇;手语理解的统计模型研究[D];中国科学院研究生院(计算技术研究所);2001年
4 崔艳秋;基于小波域统计模型的图像去噪算法研究[D];吉林大学;2006年
5 李贤;基于统计模型的汉语歌声合成研究[D];中国科学技术大学;2015年
6 黄建忠;商业银行违约损失率估计模型构建研究[D];南京农业大学;2011年
7 陈婧;基于统计模型的中国南方稻区适宜施氮量及氮素损失估算[D];南京农业大学;2011年
8 彭志行;基于抗病毒治疗与艾滋病疫情关联的统计模型研究[D];南京医科大学;2013年
9 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
10 马宗伟;基于卫星遥感的我国PM_(2.5)时空分布研究[D];南京大学;2015年
中国硕士学位论文全文数据库 前10条
1 乔世阳;微波氮化镓功率器件物理基统计模型研究[D];电子科技大学;2018年
2 陈治均;~(12)C+~(13)C在库仑位垒附近能区的熔合截面测量[D];中国科学院大学(中国科学院近代物理研究所);2017年
3 常晶晶;多层及其交叉分类累加方法的统计模型[D];海南大学;2015年
4 王劭寅;基于区域统计模型的正颌手术仿真关键算法研究[D];西北大学;2012年
5 周卉;40nm MOSFET统计模型的研究与实现[D];华东师范大学;2013年
6 骆桢轩;组合统计模型在程序错误定位中的应用[D];上海交通大学;2010年
7 王云龙;汽车运输企业能源消耗统计模型的研究[D];吉林大学;2006年
8 王宏涛;统计模型中奇异粒子比研究[D];华中师范大学;2016年
9 韩承渝;一种基于风险和无风险投资的半参统计模型的估计[D];山东大学;2009年
10 王明月;基于张量分解的统计模型及其应用[D];苏州科技大学;2016年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026