收藏本站
《北京大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度学习的实体关系抽取的研究

唐弘毅  
【摘要】:当今的互联网已蕴含了越来越多的知识,通过这些知识,我们不但可以构建庞大的知识库,还能将之运用于智能问答等诸多领域。因此如何搜集并运用这些知识俨然已经成为十分有意义的课题。我们知道,大部分知识都可由实体之间的关系所表示,因此从文本中挖掘知识的过程在一定程度上可以看作是抽取实体之间关系的过程。关于实体关系抽取的研究由来已久。不过最早的时候,人们仅仅是采用基于规则的方法来解决这一问题,这种方法在大多数情况下耗时耗力,且效果不佳。不过随着统计学习方法的崛起,人们运用机器学习技术在该问题上取得了不小的突破。而随着近些年来深度学习技术的不断发展,RNN、CNN等模型的不断提出,该问题的效果又得到了进一步的改善。本文使用了最新的深度学习技术,提取了词向量、上位词向量、词性以及相对位置四种特征,并分别采用了基于原始文本结构和基于依存分析结构两种策略来解决该问题。其中,前一种策略主要依靠基于RNN的Attention机制来捕获关键词信息,依靠CNN模型来捕获短语搭配信息。而后一种策略则是在依存分析路径上建立了CNN模型,和前一种策略相比虽增加了依存分析的预处理过程,然而由于其输入规模小,在训练速度上有着巨大的优势,而在最终结果上也没有逊色很多。根据这两种方法的异质性,本文还采取了两种集成策略将它们结合起来,以获得了更优的分类效果。在实体关系抽取经典的数据集SemEval-2010 Task8上,本文取得了较为优异的85.2%的F值,由此可见,融合了两种不同结构的策略可以更加有效地解决实体抽取问题。
【学位授予单位】:北京大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.1;TP183

【相似文献】
中国期刊全文数据库 前10条
1 李真;张优敏;夏冬梅;靳冲;;基于句法分析的实体关系抽取[J];科技风;2018年15期
2 刘绍毓;李弼程;郭志刚;王波;陈刚;;实体关系抽取研究综述[J];信息工程大学学报;2016年05期
3 郭喜跃;何婷婷;胡小华;陈前军;;基于句法语义特征的中文实体关系抽取[J];中文信息学报;2014年06期
4 周舜哲;;基于句法语义特征的中文实体关系抽取[J];北方文学;2016年20期
5 朱姗;;基于规则和本体的实体关系抽取系统研究[J];情报杂志;2010年S2期
6 李煜甫;黄蔚;胡国超;;弱监督军事实体关系识别[J];电子设计工程;2018年01期
7 朱艳辉;李飞;胡骏飞;钱继胜;王天吉;;基于三支决策的两阶段实体关系抽取研究[J];计算机工程与应用;2018年09期
8 武文雅;陈钰枫;徐金安;张玉洁;;中文实体关系抽取研究综述[J];计算机与现代化;2018年08期
9 周利娟;林鸿飞;罗文华;;基于实体关系的犯罪网络识别机制[J];计算机应用研究;2011年03期
10 董丽丽;高山;张翔;;集成学习算法在实体关系抽取中的应用[J];西安建筑科技大学学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前9条
1 车万翔;刘挺;李生;;实体关系自动抽取[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 庄成龙;钱龙华;周国栋;;基于树核函数的实体关系抽取方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 徐芬;王挺;陈火旺;;基于SVM方法的中文实体关系抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 张苇如;孙乐;韩先培;;基于维基百科和模式聚类的实体关系抽取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 王浩畅;赵铁军;于浩;;基于文本的生物信息获取[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 甘甜;莫倩;张华平;;基于搜索引擎的人物社会关系抽取研究[A];第五届全国信息检索学术会议论文集[C];2009年
7 姚天昉;;一种用于汉语信息抽取的词汇本体[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 王智坚;李水平;包洋;李金娟;张莨;;烟叶交售排队系统的设计与分析[A];中国烟草学会2016年度优秀论文汇编—— 信息化管理主题[C];2016年
9 石志强;李涛;孙延涛;;基于以太网的宽带社区网络管理系统[A];2003年通信软件技术学术年会论文集[C];2003年
中国重要报纸全文数据库 前1条
1 著名律师 高树;程序合法决定结果合法[N];深圳特区报;2012年
中国博士学位论文全文数据库 前10条
1 张晓峰;基于核方法的实体关系抽取研究[D];东南大学;2016年
2 郑巍;基于文本挖掘的生物医学实体关系抽取研究[D];大连理工大学;2018年
3 赵哲焕;生物医学实体关系抽取研究[D];大连理工大学;2017年
4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
5 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
6 郭喜跃;面向开放领域文本的实体关系抽取[D];华中师范大学;2016年
7 顾静航;面向生物医学领域的实体关系抽取研究[D];苏州大学;2017年
8 张宏涛;面向生物文本的实体关系自动抽取问题研究[D];清华大学;2012年
9 陈忱;面向Web的实体关系查询与分析关键技术研究[D];东北大学;2013年
10 甘丽新;基于句法和语义分析的中文实体关系抽取[D];江西财经大学;2017年
中国硕士学位论文全文数据库 前10条
1 唐弘毅;基于深度学习的实体关系抽取的研究[D];北京大学;2018年
2 李金绘;法制领域案件的实体关系抽取研究[D];昆明理工大学;2018年
3 王宋祥;非限定类型的实体关系抽取研究[D];湖南师范大学;2018年
4 刁云澜;基于主题微博的人物实体关系提取研究[D];西华大学;2018年
5 张硕望;一种基于远程监督的中文实体关系抽取方法[D];南华大学;2018年
6 郭莉莉;藏语实体关系抽取研究[D];中央民族大学;2018年
7 赵龙一;基于浅层分析的量化关系抽取方法研究[D];湖南大学;2014年
8 武晓阳;面向海量互联网中文文本的实体关系抽取研究与实现[D];北京邮电大学;2018年
9 黄恺瑜;弱监督条件下的实体关系抽取探究[D];北京邮电大学;2018年
10 唐敏;基于深度学习的中文实体关系抽取方法研究[D];西南交通大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026