收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

复杂网络中的链路预测研究

李艳丽(Yan-Li Lee)  
【摘要】:复杂网络中的链路预测研究的核心任务是预测各类真实网络中连边的存在性。链路预测在现实生活中有着广泛的应用场景。例如,在生物医学领域,链路预测可用于推断分子之间的交互关系,降低生物医学的实验成本;在社会经济领域,链路预测可为用户推荐好友和商品等,帮助用户快速获取相关信息且助力平台提升利润;在数据挖掘技术相关领域,链路预测可辅助网络数据矫正及补全,也可作为社团发现、知识图谱构建、关键节点挖掘等科学问题的关键技术手段提升数据挖掘任务的效果。除广泛的应用价值以外,链路预测也可在理论层面作为“试金石”对现有网络生成机制的可靠性进行验证。随着数据获取和存储技术的提升,针对大量真实网络的分析研究成为可能,这也为复杂网络上的链路预测研究带来了新的机遇和挑战:首先,旧有的链路预测算法基于少量网络设计,这些算法是否足以解决不同领域网络上的链路预测问题?广为大家认可的共同邻居(或三角闭包、聚集性等)机制是否仍能解释大部分网络的连边生成过程?其次,不同网络具有不同的拓扑结构,这导致链路预测算法预测性能并不稳定,在特定网络上表现好的算法在其他网络上表现较差。最后,在数据稀疏性挑战下以及数据之间的关联性带来的机遇下,人们构造了越来越复杂的网络,而旧有的基于简单网络的链路预测算法难以直接迁移到复杂类型的网络中,如何挖掘更复杂类型的网络信息以提升算法的预测性能也非常具有挑战。针对这些问题,本文将从复杂网络上链路预测的局限性、稳定性、准确性、复杂性四个层面开展研究,主要的内容和创新点如下:(1)针对现有链路预测算法的潜在局限性,研究了二阶框架下的链路预测算法在海量网络中的适用性。基于线性假设提出了基于线性优化的链路预测算法(Linear Optimization,简称LO)。与基准算法相比,LO准确性高且可适用于多种类型的网络,如加权网络和有向网络。针对LO解析解进行了深入分析,发现经典二阶路径框架下相似性算法(或指标)的预测性能差于基于三阶路径框架下的相似性算法(或指标)。进而,本文对比了基于二阶框架和三阶框架下的四组算法。结果表明两个框架下的算法在海量网络中平分秋色,且三阶路径框架下的算法更适合度异配性、网络密度和平均聚集系数都较低的网络。本文还发现基于局部社团连接范式的算法整体表现更好。本研究有助于加深人们对网络中节点间局部连接模式的认识。(2)针对现有链路预测算法的不稳定性,结合协同过滤思想和相似性理论提出了表现稳定的链路预测框架。相似性理论指出相似的节点之间更倾向于连接彼此,协同过滤思想则认为相似的节点倾向于连接相同或相似的节点。基于两者的不同,本文提出了基于协同过滤的增强框架(Collaborative Filtering,简称CF)和自含协同过滤增强框架(Self-included Collaborative Filtering,简称SCF)。大量实验表明,基于相似性的链路预测算法的预测效果在CF框架下可获得提升,而SCF框架可进一步提升CF框架下算法的预测性能。这两个框架在不同稀疏性的数据集中表现都稳定地优于原始算法。此外,基于SCF框架的增强算法与精心设计、考虑了全局信息的链路预测算法相比,预测性能上富有竞争力且在时间复杂度上占有优势。本研究为基于相似性的链路预测算法提供了一个简单、可解释强、预测性能稳定高效的框架。(3)针对设计准确性更高的链路预测算法的需求,提出了两个基于特征向量贡献分配的链路预测算法。本文指出CN相似性可由目标网络对应的邻接矩阵的特征向量线性表示,每个特征向量对CN相似性的贡献正比于其相应特征值的平方。然而,大量真实网络的最大特特征值和第二大特征值之间存在较大差距,这导致CN相似性由最大特征向量主导,其他特征向量的信息被弱化。基于此,本文分别提出了控制特征向量贡献分配的无参算法(Controlling the Leading Eigenvector,简称CLE)和含参算法CLE*。与原始的CN指标相比,CLE和CLE*显著提升了其预测准确性。此外,CLE和CLE*在预测性能上整体超越了对应的无参基准算法和含参基准算法,且其时间复杂度比考虑了全局信息的算法低。本研究除提供了准确性更高的链路预测算法,也为从数学角度理解CN指标提供了新视角。(4)针对复杂类型的网络上的链路预测问题,提出了耦合网络上的社会化推荐算法。本文将社会化推荐问题建模为由用户—用户社交网络和用户—物品二分网络构成的耦合网络上的层间链路预测问题,并假设存在一个潜在用户兴趣相似性矩阵可同时用于推断社交网络和用户—物品二分网络。通过两个观测网络的相互约束,提出了一个基于线性优化的社会化推荐算法(Social Recommendation via Linear Optimization,简称SLO)。实验结果表明SLO与六个基准算法相比,在四个推荐准确性指标和两个推荐多样性指标上更具优势。本研究提供了一个可应对准确性—多样性困境、数据稀疏性挑战、冷启动挑战的推荐算法。


知网文化
【相似文献】
中国期刊全文数据库 前13条
1 许小可;许爽;朱郁筱;张千明;;复杂网络中链路的可预测性[J];复杂系统与复杂性科学;2014年01期
2 刘大伟;吕元娜;余智华;;一种改进的复杂网络链路预测算法[J];小型微型计算机系统;2016年05期
3 邵豪;王伦文;邓健;;一种基于密度峰值聚类的链路预测算法[J];小型微型计算机系统;2020年05期
4 陈嘉颖;于炯;杨兴耀;卞琛;;基于复杂网络节点重要性的链路预测算法[J];计算机应用;2016年12期
5 王秋杰;尹心明;;链路预测算法在药物推荐中的应用研究[J];计算机与数字工程;2019年09期
6 杨旭华;凌非;;一种基于局部社团和全局信息的链路预测算法[J];浙江工业大学学报;2017年01期
7 丁大钊;陈云杰;靳彦青;刘树新;;基于拓扑连接紧密度的相似性链路预测算法[J];计算机应用;2017年08期
8 高杨;张燕平;钱付兰;赵姝;;结合节点度和节点聚类系数的链路预测算法[J];小型微型计算机系统;2017年07期
9 王鑫;陈喜;钱付兰;张燕平;;结合共同邻居贡献度的节点相似性链路预测算法[J];数据采集与处理;2018年05期
10 黄子轩;马超;徐瑾辉;黄江楠;;复杂网络中集聚系数对链路预测算法的影响[J];科技视界;2014年12期
11 冯仁君;陈海雁;王芳;;基于网络嵌入和关联相似性的链路预测算法[J];计算技术与自动化;2020年02期
12 杨旭华;俞佳;张端;;基于局部社团和节点相关性的链路预测算法[J];计算机科学;2019年01期
13 易灿;何敏;吴帮吕;吕亮;;一种融合社区关系及共同邻居社区信息的链路预测算法[J];电子测量与仪器学报;2021年05期
中国重要会议论文全文数据库 前20条
1 席超;胡江燕;杨莹;苏旭阳;文霄杰;王记荣;蔡劲;;基于数字孪生的巨型星座系统智能健康管理研究[A];第十七届卫星通信学术年会论文集[C];2021年
2 王云鹏;赵海;司帅宗;王翠荣;;基于邻居修正的随机游走链路预测算法[A];第十二届沈阳科学学术年会论文集(理工农医)[C];2015年
3 朱斌;樊祥;马东辉;程正东;;窗口大小和权值模板对固定权值背景预测算法的影响[A];2006年全国光电技术学术交流会会议文集(D 光电信息处理技术专题)[C];2006年
4 郭景峰;代军丽;马鑫;王娟;;针对通信社会网络的时间序列链接预测算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
5 王峰;姬冰辉;李斗;;一种基于混沌理论的自相似业务流预测算法研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
6 陈娜;戴树岭;;基于模型的遥操作预测算法研究[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年
7 张利萍;李宏光;;改进的灰色预测算法在工业应用中的评价[A];第二届全国信息获取与处理学术会议论文集[C];2004年
8 钱正祥;徐华;张申浩;;数字信号序列的向量预测算法[A];第三届全国信息获取与处理学术会议论文集[C];2005年
9 崔冬;;一种改进的LRP信道预测算法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
10 梁适春;张晓冬;林培峰;牛萌;;一种混合储能光伏发电系统的功率预测算法[A];中国电工技术学会学术年会——新能源发电技术论坛论文集[C];2013年
11 路迎晨;李兵;;一类自适应预测算法的全局收敛性[A];04'中国企业自动化和信息化建设论坛暨中南六省区自动化学会学术年会专辑[C];2004年
12 杨国俊;朱晓东;;基于BBS挖掘的危机预测算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
13 朱斌;孙斌;;基于XMPP通信集群的分类回归树和KNN结合的负载均衡预测算法[A];2016年全国通信软件学术会议程序册与交流文集[C];2016年
14 王佳;殷海兵;周冰倩;;一种适合硬件实现的低复杂度MAD预测算法[A];浙江省电子学会2011学术年会论文集[C];2011年
15 黄川;郑宝玉;;一种多无线电多信道环境下新的信道状态预测算法[A];2009年通信理论与信号处理学术年会论文集[C];2009年
16 张晓丹;王萍;;一种基于特征的H.264的子块快速帧内预测算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
17 郑德忠;赵永磊;;基于新型广义预测算法的板厚软测量方法的研究[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅲ)[C];2008年
18 石凯凯;毛功平;;小球藻生物柴油燃烧反应动力学模型的简化和优化[A];中国化学会第三届全国燃烧化学学术会议摘要集[C];2019年
19 刘杰;肖红;;心率变异分析及预测算法研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年
20 焦永;赵锐;陈跃跃;;基于模糊加权的动态自适应分支预测算法研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册)[C];2006年
中国博士学位论文全文数据库 前20条
1 李艳丽(Yan-Li Lee);复杂网络中的链路预测研究[D];电子科技大学;2021年
2 丁静怡;复杂网络的链路预测算法及其应用研究[D];西安电子科技大学;2017年
3 尚可可;基于局部链路预测和零模型的复杂网络结构及稳定性分析[D];西北工业大学;2017年
4 杨育捷;复杂网络下基于拓扑相似性的链路预测研究[D];北京邮电大学;2019年
5 陈广福;基于非负矩阵分解的链路预测算法及其应用研究[D];深圳大学;2020年
6 陈其松;智能优化支持向量机预测算法及应用研究[D];贵州大学;2009年
7 张千明;复杂网络结构分析与链路预测[D];电子科技大学;2016年
8 卜云;混沌时间序列自适应预测算法研究[D];电子科技大学;2010年
9 谭索怡;复杂网络链路预测及其在网络瓦解中的应用[D];国防科技大学;2018年
10 潘黎明;复杂网络上的链路预测及信息传播研究[D];电子科技大学;2019年
11 马玉韬;基于滤波理论和特征统计的蛋白质编码区预测算法研究[D];天津大学;2013年
12 武晓敏;复杂网络重构、链路预测算法研究及应用[D];西安电子科技大学;2020年
13 朱旭振;复杂网络下基于链路预测的推荐技术研究[D];北京邮电大学;2015年
14 鲍漪澜;基于支持向量机的金融时间序列分析预测算法研究[D];大连海事大学;2013年
15 李楠;基于火焰自由基成像的NO_x排放预测算法研究[D];华北电力大学(北京);2017年
16 刘辉;铁路沿线风信号智能预测算法研究[D];中南大学;2011年
17 刘辉;miRNA靶标预测的系统生物学方法研究[D];中国矿业大学;2009年
18 李龙杰;复杂网络中链接预测与角色相似性计算方法研究[D];兰州大学;2014年
19 白伸伸;基于结构相似性的链接预测方法研究[D];兰州大学;2020年
20 刘树新;复杂网络拓扑演化及链路预测关键技术研究[D];战略支援部队信息工程大学;2016年
中国硕士学位论文全文数据库 前20条
1 吕亚楠;基于网络结构和随机游走理论的链路预测算法研究[D];武汉理工大学;2019年
2 王小平;复杂网络中基于相似性的链接预测算法研究[D];兰州大学;2015年
3 高杨;基于局部结构的复杂网络链路预测算法研究[D];安徽大学;2017年
4 吕元娜;基于相似性的链接预测算法研究[D];山东大学;2015年
5 张志刚;复杂网络中遗失链接预测算法研究[D];中国石油大学(华东);2018年
6 张志学;基于局部结构和路径影响力的链路预测算法研究[D];兰州大学;2021年
7 贾承丰;基于有监督学习的链路预测算法[D];武汉理工大学;2019年
8 董鑫鑫;基于自然权重和势理论的链路预测算法研究[D];燕山大学;2021年
9 董鑫鑫;基于自然权重和势理论的链路预测算法研究[D];燕山大学;2021年
10 高宏屹;基于网络表示学习的链路预测算法研究[D];江南大学;2020年
11 钱吕见;复杂网络中基于角色传递性和对称性的链接预测算法研究[D];兰州大学;2016年
12 杨燕琳;基于节点高阶特征的链路预测算法[D];青海师范大学;2020年
13 郭名康;基于拓扑结构与网络表示学习的链路预测算法研究[D];兰州大学;2020年
14 辛霆麟;基于标签传播的链路预测算法研究与应用[D];北京交通大学;2014年
15 李小丽;基于互补性指标融合的链路预测[D];西安电子科技大学;2021年
16 吴帮吕;基于网络特征融合的链路预测算法研究[D];云南大学;2020年
17 张海丰;基于网络拓扑结构的链路预测算法研究[D];浙江工业大学;2017年
18 张鹏远;基于邻居社区与节点重要性的链路预测算法[D];国防科学技术大学;2015年
19 王亮;链接预测算法及应用[D];湘潭大学;2013年
20 刘欣蕊;基于网络节点贡献度的链路预测算法研究[D];兰州大学;2020年
中国重要报纸全文数据库 前1条
1 本报记者 黄婉媛;探寻文化相似性有利化解纷争[N];中山日报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978