基于深度学习的大规模图数据挖掘
【摘要】:随着大数据思维逐渐深入人心以及深度学习的广泛研究和应用,图结构逐渐被用来表征现实世界中大规模的、错综复杂的数据,而深层挖掘大规模图数据内部隐含的信息也逐渐成为了研究的热点。在信息爆炸的时代,传统的基于关键字匹配的搜索引擎已经难以满足用户希望迅速、准确、简便地获取信息的需求,为此知识图谱通过建立基于语义的信息实体图来满足人们新的查询需求。本文首先通过回顾学者、科研机构及公司对知识图谱的研究内容,对知识图谱的发展和构建方法作了全面的介绍,包括知识图谱概念的起源、发展以及最终形成过程;构建知识图谱的数据来源;构建过程中涉及的方法,包括本体和实体的抽取,图谱的构建、更新、维护,以及面向知识图谱的内部结构挖掘和外部扩展应用。最后,对知识图谱的未来发展方向和面临的挑战作了展望。针对大规模图数据挖掘面临的计算复杂、数据稀疏的问题,本文在word2vec算法基础上进行改进设计了一种基于深度学习的网络表示学习算法,通过将图结点表示为低维向量为图数据挖掘工作中能够使用成熟的机器学习算法和线性代数的理论和工具提供了可能。该算法针对图结点的多标签分类任务,利用部分标签信息指导在结点间游走的过程,然后使用逻辑回归分类模型对结点的特征表示进行多标签分类。实验结果显示通过有指导地游走,标签分类准确率有明显提升。另外,本文利用网络表示学习算法得到的图结点的向量表示设计了一种生成边特征表示的组合方法,同时通过构建深度置信网络的分类模型,实现了对复杂网络的链路预测。
|
|
|
|
1 |
黄源,张福炎;数据挖掘及其技术实现[J];计算机应用与软件;2001年12期 |
2 |
香丽芸;浅谈数据挖掘及其应用[J];昌吉师专学报;2001年02期 |
3 |
郑雪燕,张杰明,岳洋;数据挖掘语言[J];计算机时代;2001年11期 |
4 |
刘明晶;数据挖掘[J];华南金融电脑;2001年04期 |
5 |
张伟;刘勇国;彭军;廖晓峰;吴中福;;数据挖掘发展研究[J];计算机科学;2001年07期 |
6 |
钟晓;马少平;张钹;俞瑞钊;;数据挖掘综述[J];模式识别与人工智能;2001年01期 |
7 |
朱建平,张润楚;数据挖掘的发展及其特点[J];统计与决策;2002年07期 |
8 |
傅岚;在数据海洋中打捞信息数据挖掘[J];科技广场;2002年11期 |
9 |
李峻;数据挖掘,企业洞察先机的“慧眼”[J];中国计算机用户;2002年48期 |
10 |
罗可,蔡碧野,卜胜贤,谢中科;数据挖掘及其发展研究[J];计算机工程与应用;2002年14期 |
11 |
;2002数据挖掘研讨班[J];计算机工程;2002年06期 |
12 |
韩双霞;李萍;;数据挖掘:构筑企业竞争优势[J];金卡工程;2002年08期 |
13 |
林阳;数据挖掘在教育信息化中的潜在价值[J];现代教育技术;2002年01期 |
14 |
蒋良孝,蔡之华;一种新兴的数据挖掘方法:神经规则法[J];计算机工程与应用;2003年15期 |
15 |
朱世武
,崔嵬
,张尧庭
,谢邦昌;数据挖掘运用的理论与技术[J];统计研究;2003年08期 |
16 |
王晓涓,祁慧敏;数据挖掘漫谈[J];天中学刊;2003年02期 |
17 |
陈伟志,魏振军,王春迎;多元统计分析在数据挖掘中的作用[J];信息工程大学学报;2003年04期 |
18 |
赵涛;;数据挖掘在金融行业的运用[J];金融电子化;2004年03期 |
19 |
韩江;数据挖掘——极具发展潜力的新领域[J];苏州市职业大学学报;2004年01期 |
20 |
李菁菁,邵培基,黄亦潇;数据挖掘在中国的现状和发展研究[J];管理工程学报;2004年03期 |
|