收藏本站
《哈尔滨工业大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

基于张量的多关系图挖掘关键技术研究

李旭涛  
【摘要】:随着科学技术的飞速发展,越来越多领域中实体间的相互作用或关联关系可被测量和记录,譬如生物学中蛋白质之间的相互作用、用户在社交网络的通信、互联网各个计算机的连接情况、环保领域水污染扩散过程等。由于这些实体间的相互作用关系可以被表示成一个图,因而在学术界引起了图挖掘研究热潮的兴起。目前研究的热点主要集中在单关系图上,其刻画的是一种实体间的一种作用关系。然而,在现实世界中实体间的相互作用通常较为复杂,具有实体多元性、作用多类型和作用超二元性等特性。譬如在社会化媒体网络中,包含用户、故事、评论等多种实体,作用关系包括好友关系、评论关系、群组关系等,而且群组关系表示的是超过两个用户之间的相互作用。这样的复杂网络需要用多关系图来刻画,即图中包含不同的类型节点和不同类型的边,且一条边可以连接两个上的节点。 多关系图挖掘具有重要的意义,其能帮助人们揭示复杂作用系统中有价值的信息。譬如,挖掘多关系图中节点的重要性将有助于互联网链接分析、社交网络核心或枢纽成员的鉴别、微博系统用户影响力的判断等;挖掘学术多关系图中的社区将有助于找到某一特定研究领域中紧密关联的作者、论文、关键词;挖掘生物多关系图中的模块将有助于发现特定生物功能的组织。然而对于这种类型的图,目前的研究结果和挖掘技术还很少。因此,本文针对这种多关系图展开研究,主要考虑节点重要性计算和社区发现问题,并以张量为载体提出了一系列算法来解决这两个问题。本文的主要研究内容和创新包括: 1.针对多关系图挖掘理论基础缺乏的问题,提出了张量马尔可夫链模型,通过张量积近似的方法将高阶马尔可夫链极限概率的求解问题转变成张量等式的求解问题,提出了类似幂法的迭代求解算法。从理论上分析了该模型的解的存在性、唯一性以及求解算法的收敛性。并通过实验结果验证了该模型的有效性。该模型是整个论文研究工作的理论基础,其作为主线贯穿整个研究问题。 2.针对多关系图中查询无关的节点重要性计算问题,提出了MultiRank算法和HAR算法。这两个算法以张量马尔可夫链模型为基础,将PageRank算法和HITS算法的思想扩展到多关系图上以解决节点重要性计算问题。从理论上分析了MultiRank算法和HAR算法的解的存在性、唯一性以及求解算法收敛性。在DBLP数据上的实验结果表明MultiRank算法和HAR算法能够合理有效的给出节点和关系的重要性。 3.针对多关系图中查询相关的节点重要性计算问题,提出了MultiVCRank算法。该算法将张量马尔可夫链模型和带回位的随机游走思想结合起来,巧妙的将查询输入融入马尔可夫链当中。通过理论分析,证明了MultiVCRank算法的解的存在性,并且证明当回位参数满足一定条件时,MultiVCRank算法收敛到唯一解。在TREC文本数据和Corel图像数据上的实验结果表明MultiVCRank算法的检索效果明显优于传统算法。 4.针对时序无关多关系图中的社区发现问题,提出了MultiComm算法。面向可表示为多个张量的多关系图,MultiComm算法基于多个张量建立带回位的马尔可夫链,以其极限概率来反映节点之间的相似性,从而逐步将图中节点加入社区中以找到社区结构。理论结果分析表明在一定条件下MultiComm算法结果是唯一的。模拟数据和SIAM/DBLP数据上的实验结果表明MultiComm的社区发现效果优于当前最好算法。 5.针对时序相关多关系图中的社区发现问题,提出了MultiFacTV算法。该算法通过在张量分解目标函数中引入TV(totalvariation)项来约束时间维的分解向量,从而保持社区结构的时间特性。理论分析结果表明MultiFacTV算法能够收敛到局部最优解。实验结果表明MultiFacTV的效果优于Multifac算法和EDISA算法,且在拟南芥、酵母和智人生物时序多关系图数据上发现了有意义的生物模块。总体而言,本文紧扣多关系图中节点重要性计算和社区发现两个研究问题,建立张量马尔可夫链模型作为理论基础和贯穿研究内容的主线,提出了MultiRank/HAR算法,MultiVCRank算法,MultiComm算法和MultiFacTV算法。本文的研究将推动多关系图挖掘的进一步发展,并且有望为张量和马尔可夫链的研究带来新方向。
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP311.13

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 赵毅寰;王祖林;郑晶;郭旭静;;利用重要性贡献矩阵确定通信网中最重要节点[J];北京航空航天大学学报;2009年09期
2 金弟;刘大有;杨博;刘杰;何东晓;田野;;基于局部探测的快速复杂网络聚类算法[J];电子学报;2011年11期
3 张伟哲;王佰玲;何慧;谭卓鹏;;基于异质网络的意见领袖社区发现[J];电子学报;2012年10期
4 潘磊;金杰;王崇骏;谢俊元;;社会网络中基于局部信息的边社区挖掘[J];电子学报;2012年11期
5 赫南;李德毅;淦文燕;朱熙;;复杂网络中重要性节点发掘综述[J];计算机科学;2007年12期
6 王刚;钟国祥;;基于信息熵的社区发现算法研究[J];计算机科学;2011年02期
7 张翼;刘玉华;许凯华;骆珍荣;;一种基于互信息的复杂网络节点重要性评估方法[J];计算机科学;2011年06期
8 吴刚;张阔;李涓子;王克宏;;利用相互增强关系迭代计算本体中概念与关系的重要性[J];计算机学报;2007年09期
9 刘发升;罗延榕;;基于多种群遗传算法的复杂网络社区结构发现[J];计算机应用研究;2012年04期
10 王红;王希诚;;随机走步软聚类识别蛋白质网交叠功能模块[J];计算机工程与应用;2011年09期
【共引文献】
中国期刊全文数据库 前10条
1 李东生;高明伦;;高密度集成与单芯片多核系统及其研究进展[J];半导体技术;2012年02期
2 武森;魏桂英;白尘;张桂琼;;分类属性高维数据基于集合差异度的聚类算法[J];北京科技大学学报;2010年08期
3 周方俊;;一种加权IDIOSCAL模型的非度量分析方法[J];纯粹数学与应用数学;1991年01期
4 梁军利;杨树元;张军英;;一种信号频率及二维到达角联合估计新方法[J];电波科学学报;2007年06期
5 武鹏飞;宫辉力;周德民;;基于复杂网络的官厅水库流域土地利用/覆被变化[J];地理学报;2012年01期
6 赵金利;张群华;余贻鑫;贾宏杰;杨锦;;输电网网架结构的谱聚类分析算法[J];电力系统及其自动化学报;2009年04期
7 涂航;佘新荷;杨灿;;网络安全风险可视化应用研究[J];电脑知识与技术;2011年13期
8 李翔;李仕强;赵青虎;;基于边聚类方法的复杂网络社团挖掘研究[J];电脑知识与技术;2012年10期
9 王娟;靳京;钱伟中;秦志光;;基于小波分解的群落流量异常检测[J];电子测量与仪器学报;2010年04期
10 梁军利;王诗俊;高丽;杨树元;张军英;;一种无须参数配对的近场源定位新算法[J];电子学报;2007年06期
中国重要会议论文全文数据库 前10条
1 ;Urban Traffic Complex Network Hub Node Analysis and Signal Control Optimization Strategy Research[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 朱绍华;吴海龙;夏阿林;韩清娟;张艳;俞汝勤;;激发发射矩阵荧光与二阶校正方法相结合用于河水中西维因降解动力学过程定量分析研究[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
3 孙江明;李通化;;三维非负张量分解及其在反应动力学中的应用[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
4 康超;吴海龙;于永杰;刘亚娟;邵圣枝;俞汝勤;;一个新的四线性分解算法及其应用[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 郭景峰;陈晓;赵丽;邹晓红;;一种改进的闭图挖掘算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 佟强;;图像区域粗糙分割情况下的区域物体分类[A];第四届全国几何设计与计算学术会议论文集[C];2009年
7 王国霞;刘贺平;李擎;;二部图影射及其在推荐系统中的应用[A];第25届中国控制与决策会议论文集[C];2013年
8 孙根云;张爱竹;王振杰;;基于数据场模型的多光谱图像边缘检测[A];2013年中国智能自动化学术会议论文集(第三分册)[C];2013年
9 党兴华;贾卫峰;;技术创新网络中核心企业的知识流耦合过程控制研究[A];第三届(2008)中国管理学年会——管理科学分会场论文集[C];2008年
10 许明;吴建平;杜怡曼;谢峰;肖云鹏;;基于三部图的路网节点关键度排序方法[A];2013年全国通信软件学术会议论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 王娟;大规模网络安全态势感知关键技术研究[D];电子科技大学;2010年
2 李一啸;基于复杂网络和演化博弈理论的社会[D];浙江大学;2010年
3 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
4 王伟;铁路网抗毁性分析与研究[D];北京交通大学;2011年
5 白明;自主移动机器人的运动规划与图像理解研究[D];大连理工大学;2011年
6 徐昊;基于跨媒体信息和高效图像编码算法的图像搜索关键技术[D];中国科学技术大学;2011年
7 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
8 张磊;基于机器学习的图像检索若干问题研究[D];山东大学;2011年
9 李伟;复杂网络特征结构的挖掘方法研究[D];南京理工大学;2010年
10 彭佳扬;代谢网络中功能模块挖掘和进化分析研究[D];中南大学;2011年
中国硕士学位论文全文数据库 前10条
1 周斌;复杂网络的社团结构挖掘及应用研究[D];广西师范学院;2010年
2 杜慧;张量和小波特征的洛伦兹度量学习及其应用[D];大连理工大学;2010年
3 吕桂才;溶解有机物三维荧光光谱结合多变量分析在赤潮藻识别中的应用[D];中国海洋大学;2010年
4 张国强;TD-SCDMA系统中联合检测算法的研究[D];天津理工大学;2010年
5 方霞;代码逆向分析中的语句恢复与算法识别技术研究[D];解放军信息工程大学;2009年
6 毛菥;基于文本分析技术的新闻阅读平台的研究与实现[D];浙江大学;2011年
7 李亚杰;基于复杂网络理论的产业网络研究[D];浙江工商大学;2011年
8 谷海滨;水稻蛋白相互作用网络预测及数据库的构建[D];浙江大学;2011年
9 周永亮;非负矩阵分解问题算法的研究[D];西安电子科技大学;2011年
10 王延鹏;复杂网络重叠社区发现算法研究[D];太原理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 高博;周旖;崔英志;;Web2.0网站的特点与社区化模式[J];重庆工学院学报(自然科学版);2009年06期
2 郭伟;野战地域通信网可靠性的评价方法[J];电子学报;2000年01期
3 王建勇,谢正茂,雷鸣,李晓明;近似镜像网页检测算法的研究与评价[J];电子学报;2000年S1期
4 淦文燕;李德毅;王建民;;一种基于数据场的层次聚类方法[J];电子学报;2006年02期
5 鲁明羽;沈抖;郭崇慧;陆玉昌;;面向网页分类的网页摘要方法[J];电子学报;2006年08期
6 陈毅恒;秦兵;宋凡;刘挺;李生;;基于ontology抽取优化初始选择的检索结果聚类[J];电子学报;2008年S1期
7 孔万增;孙志海;杨灿;戴国骏;孙昌思核;;基于本征间隙与正交特征向量的自动谱聚类[J];电子学报;2010年08期
8 王雪松;谷阳阳;程玉虎;;基于复杂网络的时延基因调控网络构建[J];电子学报;2010年11期
9 金弟;刘大有;杨博;刘杰;何东晓;田野;;基于局部探测的快速复杂网络聚类算法[J];电子学报;2011年11期
10 解(亻刍);汪小帆;;复杂网络中的社团结构分析算法研究综述[J];复杂系统与复杂性科学;2005年03期
【相似文献】
中国期刊全文数据库 前10条
1 江宇闻;;Overcomplete ICA算法研究[J];中山大学研究生学刊(自然科学、医学版);2004年02期
2 杨利华;艾金花;程昔恩;;GMRES算法的收敛分析与实现[J];福建电脑;2006年02期
3 宁爱平;张雪英;;人工蜂群算法的收敛性分析[J];控制与决策;2013年10期
4 王常青,操云甫,戴国忠;用双向收敛蚁群算法解作业车间调度问题[J];计算机集成制造系统;2004年07期
5 孙学勤;刘丽;付萍;王学厚;;一种连续空间优化问题的蚁群算法及应用[J];计算机工程与应用;2005年34期
6 蔡延光;钱积新;孙优贤;;全局优化的了望算法[J];广东工业大学学报;2006年02期
7 胡爱钦;文益民;陈方;;一种等分割聚类算法的改进[J];计算技术与自动化;2006年02期
8 赵光权;彭喜元;孙宁;;基于混合优化策略的微分进化改进算法[J];电子学报;2006年S1期
9 李金汉;杜德生;;一种改进蚁群算法的仿真研究[J];自动化技术与应用;2008年02期
10 李修琳;鲁建厦;柴国钟;汤洪涛;;混合蜂群算法求解柔性作业车间调度问题[J];计算机集成制造系统;2011年07期
中国重要会议论文全文数据库 前10条
1 何敏;陈中显;梅松涛;;蚁群算法的研究与进展[A];中国计量协会冶金分会2010年会论文集[C];2010年
2 唐乾玉;韩曾晋;;基于扰动分析的优化算法[A];1994中国控制与决策学术年会论文集[C];1994年
3 高玮;;免疫连续蚁群算法[A];第二十六届中国控制会议论文集[C];2007年
4 范瑛;;改进蚁群算法结合BP网络用于入侵检测[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
5 陈元琰;闫友彪;罗晓曙;;REM算法的改进[A];广西计算机学会2005年学术年会论文集[C];2005年
6 金成勋;周广禄;郭恒业;;对ICP算法中稳定采样的研究[A];立体图象技术及其应用研讨会论文集[C];2005年
7 万丽芬;钟炎平;;约束LMS算法研究[A];第二十届电工理论学术年会论文集[C];2008年
8 云飞;薛青;姚义军;;改进型LMBP算法在军事数据分析中的应用研究[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
9 朱双东;艾智斌;阎夏;;BP网络学习算法的改进方案探析[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
10 唐乾玉;陈翰馥;韩曾晋;;串行生产线的参数优化[A];1994年中国控制会议论文集[C];1994年
中国博士学位论文全文数据库 前10条
1 王可心;大规模过程系统非线性优化的简约空间理论与算法研究[D];浙江大学;2008年
2 厉丹;视频目标检测与跟踪算法及其在煤矿中应用的研究[D];中国矿业大学;2011年
3 袁东辉;蚁群算法在飞行模拟器平台中若干应用问题的研究[D];吉林大学;2011年
4 韩飞;基于先验信息编码的约束学习算法研究[D];中国科学技术大学;2006年
5 鲍吉锋;平衡问题和优化问题若干算法的收敛性分析[D];浙江大学;2013年
6 张晓伟;全局优化的若干随机性算法[D];西安电子科技大学;2008年
7 郑洪英;基于进化算法的入侵检测技术研究[D];重庆大学;2007年
8 张骁雅;压缩感知算法及其应用的几点研究[D];浙江大学;2013年
9 傅启明;强化学习中离策略算法的分析及研究[D];苏州大学;2014年
10 周虎成;部分冗余消除优化的SSA算法研究[D];清华大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘坤;人工植物优化算法混合策略的研究及应用[D];太原科技大学;2011年
2 让辉;基于进化算法的多目标电子谈判的研究[D];武汉科技大学;2007年
3 代沆;基于蚁群算法的移动互联网服务发现算法研究[D];电子科技大学;2012年
4 魏红凯;人工蜂群算法及其应用研究[D];北京工业大学;2012年
5 刘婷婷;基于反馈的多目标人工蜂群算法研究[D];东北大学;2013年
6 章小红;基于蚁群算法的产品拆卸序列规划方法研究[D];华中科技大学;2007年
7 李鸥;求解多目标问题的思维进化算法[D];太原理工大学;2004年
8 王晓娟;类电磁机制算法及其若干应用研究[D];华中科技大学;2006年
9 宋慧;预处理Householder-GMRES(m)算法研究[D];燕山大学;2013年
10 马彦追;萤火虫算法的改进及其应用研究[D];广西民族大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026