收藏本站
收藏 | 论文排版

基于嵌入模型的知识图谱补全

王桢  
【摘要】:知识图谱是三元组的集合,其中三元组的形式是(主语,谓词,宾语),主语和宾语是实体,谓词是关系。每个三元组(例如(奥巴马,出生地,檀香山))表示一个事实。当被应用于问答系统中时,只有当一个知识图谱覆盖了问答所对应的事实,它才能够提供所需要的答案。尽管已经有多个大规模、开放领域的知识图谱问世,它们距离完备仍然有很远的距离,例如Freebase中有30%的人物实体缺少记录他们父母亲信息的三元组。知识图谱补全就是向一个已有的知识图谱中增加新的三元组,且加入的三元组必须是客观事实。主要有两个渠道的信息可以用于补全知识图谱:1.从一个知识图谱已有的三元组来推理新的三元组。2.从文本中抽取新的实体和新的三元组。为了利用第一个渠道的信息,近年涌现了大量知识图谱嵌入方面的工作,它们为每个实体学习一个稠密的向量表示,同时基于实体的向量表示计算每个三元组的可信度。这些嵌入模型能被用于推理信息抽取模型从文本中抽取得到的三元组。由于上述两个渠道是互补的,所以合并嵌入模型与信息抽取模型能够表现出较之单一模型更好的性能。我们将现有知识图谱嵌入模型存在的弱点以及将其与信息抽取模型合并所存在的挑战总结如下:1.业界领先的知识图谱嵌入模型—TransE不能妥善地处理具有自反或者一对多/多对一/多对多性质的关系。2.在训练一个知识图谱嵌入模型时,现有的负采样算法有可能产生假阴性样本。3.对于从文本中抽取的三元组,其主语和宾语是词。如果这个三元组的主语或宾语无法链接至所考虑的知识图谱中的某个实体,现有的嵌入模型因为缺少实体的向量表示进行计算,无法对其进行推理。在本文中,我们提出一系列技术去解决上述问题。本文的主要贡献包括:1.我们表明了上述首个问题源自于Trans E将每种关系建模成对于实体向量的平移操作。于是,我们提出一个新的知识图谱嵌入模型Trans H。该模型通过在进行平移操作之前首先将实体向量投影至为每种关系定义的超平面,解决了Trans E存在的上述弱点。同时,Trans H避免了增加过多模型复杂度。2.我们提出了一个数据驱动的、每种关系独有的分布,用于采样负例来训练知识图谱嵌入模型。该分布能减少抽样到假阴性样本的机会。同时,该分布的参数可以由每种关系的基本统计量确定。3.我们首先表明,在词嵌入模型—Word2Vec中,词之间的隐式关系可以被解释成对于词向量的平移操作,类似于Trans E对于知识图谱中关系的建模。基于此,我们提出了一个联合嵌入模型,去为每个实体和每个词都学习一个稠密的向量表示。我们的联合嵌入模型能够为同时涉及词和实体的三元组计算可信度。据我们所知,我们的联合嵌入模型是能够处理此类三元组的首个方法。4.我们提出三个分别基于实体链接,实体名称,实体描述的对齐模型。用于训练这些模型的监督信息都易于获取且是规模大的。经验性评估显示,这些模型能有效将词被嵌入的向量空间与实体被嵌入的向量空间所对齐。我们做了大量的实验去比较提出的模型与基准方法。实验结果表明,我们的方法在性能上优于业界领先的方法,而且更为细致的实验结果分析肯定了我们提出模型的动机。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 何莺;;浅谈图谱的设计与制作——以中班健康活动《会变暖的衣服》为例[J];新课程(下);2014年08期
2 杨大伟;周刚;卢记仓;宁原隆;;基于知识表示学习的知识图谱补全研究综述[J];信息工程大学学报;2021年05期
3 ;元宇宙公司图谱[J];中国科技信息;2022年03期
4 马小兰;;知识图谱在金融风控领域的应用研究[J];产业科技创新;2020年24期
5 单佩佩;;基于知识图谱的个性化推荐研究[J];电脑知识与技术;2020年36期
6 朱超宇;刘雷;;基于知识图谱的医学决策支持应用综述[J];数据分析与知识发现;2020年12期
7 赵东明;田雷;刘静;石理;;电信运营商知识图谱智慧运营管理系统[J];中国新通信;2021年01期
8 王晓航;宋宇鹏;李海涛;李丹;钟闻宇;揣小龙;郑永春;;人参知识域可视化信息图谱的研究分析[J];农业开发与装备;2021年01期
9 ;中国智慧医源企业图谱[J];中国科技信息;2021年Z1期
10 张美璟;;知识图谱在犯罪情报分析中的应用[J];法制与社会;2021年04期
11 胡宸恺;魏鑫;姜国强;李发强;金玉舜;;基于百科数据的林业知识图谱的构建与应用[J];智能计算机与应用;2020年10期
12 吕品;贺云艳;许嘉;莫晓琨;;面向教育的中文知识图谱自动构建技术[J];中国教育信息化;2021年04期
13 李艳茹;周子力;倪睿康;马腾;高书林;王彦冰;;基于知识图谱的学科知识构建[J];计算机时代;2021年04期
14 程开原;姚俊萍;李晓军;王伊靖;;时态网络中知识图谱推荐:关键技术与研究进展[J];中国电子科学研究院学报;2021年02期
15 刘燕;贾志杰;闫利华;邹妍;;知识图谱研究综述[J];赤峰学院学报(自然科学版);2021年04期
16 ;车联网产业图谱[J];中国科技信息;2021年11期
中国重要会议论文全文数据库 前20条
1 周晶;;知识图谱与数据应用-智能推荐[A];数字中国 能源互联——2018电力行业信息化年会论文集[C];2018年
2 黄薇;;知识图谱应用于学科知识服务初探[A];福建省图书馆学会2014年学术年会暨著名图书馆学家--金云铭先生诞辰110周年学术研讨会论文集[C];2014年
3 冯秋菊;刘军;;《文身图谱》及其在傣族文身技艺传承中的作用[A];服装历史文化技艺与发展——中国博物馆协会第六届会员代表大会暨服装博物馆专业委员会学术会议论文集[C];2014年
4 陈毓芬;廖克;;中国自然景观综合信息图谱的设计与提炼[A];地图学与GIS学术讨论会论文集[C];2002年
5 朱琳;;巧借“音乐图谱” 绽放“生本”之花——浅谈行知理论在音乐教学中的有效指导[A];2016年江苏省教育学会学术年会报告文集[C];2016年
6 李金湖;陈坤;;构建基于图数据库的电力知识图谱[A];第二届智能电网会议论文集[C];2018年
7 吴浪韬;肖亚奇;梁雄;罗征;胡振中;;基于知识图谱的机电逻辑关系检索[A];第五届全国BIM学术会议论文集[C];2019年
8 ;你问我爱你有多深,扫描图谱代表我的心[A];科学媒介中心2015年推送文章合集(上)[C];2016年
9 吕建坤;李志华;张亚伟;;呼吸图谱监测活性污泥系统处理能力[A];2019中国环境科学学会科学技术年会论文集(第三卷)[C];2019年
10 杨强;;基于知识图谱的核电设备知识平台建设[A];数字中国 能源互联——2018电力行业信息化年会论文集[C];2018年
11 魏巍;邵蓉;郑绯;;知识图谱视角下药事管理学科10年关键词分析[A];2012年中国药学会药事管理专业委员会年会暨“十二五”医药科学发展学术研讨会论文集(下册)[C];2012年
12 许仕伟;周辛南;梁晔;王海燕;刘金岭;周小鹤;席文杰;张竞文;邱凯义;;基于知识图谱的农村营销移动作业微应用系统设计与实现[A];第三届智能电网会议论文集[C];2018年
13 李祖文;范萍;孙忠清;钟春梅;汪之顼;;回顾性膳食调查辅助食物图谱对促进食物估重效率作用的评价[A];妇幼人群膳食评价互联网+技术应用研讨班资料汇编[C];2016年
14 金殷玉;曹玲;;基于知识图谱的国际应急管理研究可视化分析[A];风险分析和危机反应的创新理论和方法——中国灾害防御协会风险分析专业委员会第五届年会论文集[C];2012年
15 上交所技术有限责任公司同济大学深圳市智搜信息技术有限公司联合课题组;陶睿;;深度学习和知识图谱在智能公司监管中的应用研究[A];创新与发展:中国证券业2018年论文集(下册)[C];2019年
16 汤黎明;;神经阈值图谱及相关研究[A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集[C];2006年
17 李祖文;范萍;孙忠清;钟春梅;汪之顼;;回顾性膳食调查辅助食物图谱对促进食物估重效率作用的评价[A];达能营养中心第十三届学术研讨会“膳食脂肪与健康”论文集[C];2010年
18 龚宁波;吕扬;;X射线衍射Fourier图谱库与中药材鉴定分析[A];中国晶体学会第四届全国会员代表大会暨学术会议学术论文摘要集[C];2008年
19 江明娣;;眼科手术器械图谱的制作与应用效果观察[A];2014年12月《临床心身疾病》杂志学术研讨会综合刊[C];2014年
20 李祖文;范萍;孙忠清;钟春梅;汪之顼;;回顾性膳食调查辅助食物图谱对促进食物估重效率作用的评价[A];中国营养学会妇幼营养第七次全国学术会议论文汇编[C];2010年
中国博士学位论文全文数据库 前20条
1 王桢;基于嵌入模型的知识图谱补全[D];中山大学;2017年
2 赵宇;知识图谱自动演进算法研究[D];北京邮电大学;2017年
3 武国胜;福建省生态环境时空格局信息图谱研究[D];福建师范大学;2006年
4 李娇;基于知识图谱的科研综述生成研究[D];中国农业科学院;2021年
5 郭欣彤;大规模知识图谱的查询处理技术研究[D];哈尔滨工业大学;2021年
6 金山(Kim San);知识图谱的扩展与检错关键技术研究[D];清华大学;2019年
7 王莉;基于知识图谱的城市轨道交通建设安全管理智能知识支持研究[D];中国矿业大学;2019年
8 盛泳潘;面向知识图谱的学习算法研究与应用[D];电子科技大学;2020年
9 蒋菲;新世纪中国课程与教学论的知识图谱研究[D];湖南师范大学;2014年
10 贾宁宁;面向知识图谱扩充的知识获取关键技术研究[D];北京邮电大学;2021年
11 陈攀峰;基于稠密特征模型的知识图谱补全研究[D];贵州大学;2021年
12 陈曦;面向大规模知识图谱的弹性语义推理方法研究及应用[D];浙江大学;2017年
13 刘伟;人脑三维弥散张量影像数字化统计图谱研究[D];中国科学技术大学;2012年
14 朱继召;基于表示学习的知识图谱技术研究[D];东北大学;2018年
15 汪洋;山地人居环境空间信息图谱—理论与实证[D];重庆大学;2012年
16 芮建勋;基于遥感影像的城市景观信息图谱及其模型系统研究[D];华东师范大学;2006年
17 姜京池;基于医学知识图谱的疾病诊断与健康预测模型研究[D];哈尔滨工业大学;2019年
18 王堃;牦牛基因组遗传变异图谱和高原适应的转录组研究[D];兰州大学;2015年
19 邓文祥;证素辨证学心系辨证知识图谱的建立及其应用[D];湖南中医药大学;2020年
20 热孜万古丽·阿巴斯;我国教育管理学知识图谱研究[D];华东师范大学;2019年
中国硕士学位论文全文数据库 前20条
1 张进;基于多跳关系问答的知识图谱补全算法研究[D];上海第二工业大学;2021年
2 司佳琪;基于文本增强的知识图谱补全技术研究与应用[D];北京邮电大学;2020年
3 高烁琳;基于语义的知识图谱清洗及优化技术研究[D];哈尔滨工业大学;2021年
4 乔振浩;基于知识图谱的问答系统研究与应用[D];哈尔滨工业大学;2020年
5 付晨鹏;知识图谱必要关系判定与开放式补全技术的研究与实现[D];苏州大学;2020年
6 王哲;面向服务发现的知识图谱匹配关键技术研究[D];华北电力大学(北京);2020年
7 胡超杰;基于知识图谱的几何问题自动求解系统设计与实现[D];电子科技大学;2020年
8 胡瑾;幼儿园音乐图谱的运用研究[D];山东师范大学;2015年
9 张厚源;基于知识图谱的实体间链接预测方法研究[D];电子科技大学;2021年
10 李雪;企业知识图谱的构建及补全研究[D];青岛大学;2021年
11 卞浩然;食品质量追溯的知识图谱研究与应用[D];中国地质大学(北京);2021年
12 李光明;初中化学学科知识图谱的构建与可视化查询系统的实现[D];上海师范大学;2020年
13 陈晨;基于实验研究不同标注方式对医学图谱识别效率的影响[D];第四军医大学;2015年
14 谢晓娟;潘怀素《南宋乐星图谱研究》初探[D];温州大学;2015年
15 孙驰;基于微博的知识图谱的构建与研究[D];西华大学;2015年
16 孙祯华;益阳市百竹园竹类资源信息图谱的研究[D];中南林业科技大学;2013年
17 屈婷婷;基于知识图谱推理的问答系统设计[D];宁夏大学;2021年
18 张飞;基于集成学习方法的知识图谱嵌入研究[D];山西财经大学;2021年
19 刘宾楚;知识图谱中的多元关系挖掘方法研究与实现[D];东南大学;2020年
20 程默;基于知识图谱的乳腺肿瘤辅助诊断模型的研究[D];湖北工业大学;2021年
中国重要报纸全文数据库 前20条
1 段歆涔;首张人脑超清三维图谱问世[N];中国科学报;2013年
2 本报记者 唐凤;小技术能否绘就大图谱[N];中国科学报;2013年
3 段歆涔;首张人脑超清三维图谱问世[N];中国科学报;2013年
4 本报记者 唐凤;小技术能否绘就大图谱[N];中国科学报;2013年
5 本报记者 王秀洁;创城背后的“民生图谱”[N];日照日报;2012年
6 记者 崔雪芹;世界首张哺乳动物细胞图谱绘制完成[N];中国科学报;2018年
7 本报记者 操秀英;高效运用知识图谱需匹配行业需求[N];科技日报;2020年
8 记者 陆琦;中科院发布《科学结构图谱2017》[N];中国科学报;2017年
9 本报记者 曲晓丽;零食企业构建多维升级图谱[N];国际商报;2019年
10 本报首席记者 杨逸淇 记者 刘力源;哲学如何描绘时代的精神图谱[N];文汇报;2019年
11 本报见习记者 韩扬眉;脑连接图谱走向单细胞精度时代[N];中国科学报;2018年
12 本报通讯员 谭润昕;党建引领绘就蓝图谱新章[N];永州日报;2019年
13 本报评论员 彭训文;中国制度图谱清晰绘就[N];人民日报海外版;2019年
14 记者 张行勇;《细胞》发表史上最全癌症遗传风险图谱[N];中国科学报;2018年
15 通讯员 章咪佳 记者 宋黎胜;世界首个哺乳动物细胞图谱绘出[N];健康报;2018年
16 记者 江耘 通讯员 吴雅兰 柯溢能;世界首张哺乳动物细胞图谱成功绘制[N];科技日报;2018年
17 记者 江南;我国科学家绘制出全球首个哺乳动物细胞图谱[N];人民日报;2018年
18 本报记者 王鲁铨;贵州“图谱”详解大数据如何服务办案[N];贵州日报;2018年
19 本报见习记者 隋明照;知识服务:建立有效认知图谱[N];中国新闻出版广电报;2018年
20 记者 单毅;知识图谱助推大数据产业升级[N];滨海时报;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978