收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文命名实体及实体关系的自动抽取研究

刘亚军  
【摘要】:命名实体识别和实体关系抽取是信息抽取的两个重要任务。本文根据军事文本特点,结合ACE 2005中文数据集的命名实体类型和实体关系类型,定义军事领域文本中命名实体和实体关系的类型,进行人工标注,构建了军事领域标注数据集,并提出两种不同的抽取方法,包括基于管道方式的抽取方法和基于联合方式的抽取方法。本文的主要研究内容如下:(1)基于管道方式的抽取方法。将两个任务看成分离的子任务,独立进行处理。本文采用Lattice LSTM(Lattice Long Short Term Memory)模型对输入文本进行编码表示,融入词表匹配的词语信息,采用CRF(Conditional Random Field)层进行解码,实现中文命名实体识别。在此基础上,将关系抽取问题看作分类任务,采用PCNN(Piecewise Convolutional Neural Networks)网络模型,实现实体关系抽取。(2)基于联合方式的抽取方法。将两个任务看成一个统一的任务,任务之间信息融合,同时抽取中文命名实体和实体关系。本文提出基于状态转移网络的联合抽取方法,设计并定义转移动作,将联合抽取任务转换为转移动作序列的生成过程。该方法首先利用Lattice LSTM网络对输入文本进行编码表示,采用Stack LSTM(Stack Long Short Term Memory)实现栈的记忆功能,然后根据当前栈的状态,利用SoftMax层决定下一步转移动作,一直达到终结状态。基于状态转移网络的联合抽取方法能够识别中文嵌套实体,并实现命名实体和实体关系的联合抽取。本文在ACE 2005中文数据集和军事领域标注数据集上进行实验,根据实验结果评估管道方式和联合方式的模型性能。在ACE 2005中文数据集上,基于状态转移网络的联合抽取方法在中文命名实体识别结果上,F1值达到75.26%,实体关系抽取F1值达41.28%。相比于管道方式,命名实体识别结果提升8.45%,实体关系抽取结果提升12.41%。实验结果表明基于状态转移网络的中文命名实体和关系联合抽取方法优于基于管道方式的抽取方法。


知网文化
【相似文献】
中国期刊全文数据库 前18条
1 李真;张优敏;夏冬梅;靳冲;;基于句法分析的实体关系抽取[J];科技风;2018年15期
2 刘绍毓;李弼程;郭志刚;王波;陈刚;;实体关系抽取研究综述[J];信息工程大学学报;2016年05期
3 郭喜跃;何婷婷;胡小华;陈前军;;基于句法语义特征的中文实体关系抽取[J];中文信息学报;2014年06期
4 周舜哲;;基于句法语义特征的中文实体关系抽取[J];北方文学;2016年20期
5 朱姗;;基于规则和本体的实体关系抽取系统研究[J];情报杂志;2010年S2期
6 李煜甫;黄蔚;胡国超;;弱监督军事实体关系识别[J];电子设计工程;2018年01期
7 朱艳辉;李飞;胡骏飞;钱继胜;王天吉;;基于三支决策的两阶段实体关系抽取研究[J];计算机工程与应用;2018年09期
8 武文雅;陈钰枫;徐金安;张玉洁;;中文实体关系抽取研究综述[J];计算机与现代化;2018年08期
9 周利娟;林鸿飞;罗文华;;基于实体关系的犯罪网络识别机制[J];计算机应用研究;2011年03期
10 董丽丽;高山;张翔;;集成学习算法在实体关系抽取中的应用[J];西安建筑科技大学学报(自然科学版);2011年03期
11 牟晋娟;包宏;;中文实体关系抽取研究[J];计算机工程与设计;2009年15期
12 朱鸿宇;刘瑰;陈左宁;唐福华;;实体关系识别中长距离依赖问题的研究[J];小型微型计算机系统;2008年02期
13 刘路;李弼程;张先飞;孙显著;;基于单实体语言模型的实体关系发现和描述[J];信息工程大学学报;2008年03期
14 徐健;张智雄;吴振新;;实体关系抽取的技术方法综述[J];现代图书情报技术;2008年08期
15 李颖;郝晓燕;王勇;;中文开放式多元实体关系抽取[J];计算机科学;2017年S1期
16 杨锦锋;于秋滨;关毅;蒋志鹏;;电子病历命名实体识别和实体关系抽取研究综述[J];自动化学报;2014年08期
17 雷春雅;郭剑毅;余正涛;毛存礼;张少敏;黄甫;;基于自扩展与最大熵的领域实体关系自动抽取[J];山东大学学报(工学版);2010年05期
18 车万翔,刘挺,李生;实体关系自动抽取[J];中文信息学报;2005年02期
中国重要会议论文全文数据库 前9条
1 车万翔;刘挺;李生;;实体关系自动抽取[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 庄成龙;钱龙华;周国栋;;基于树核函数的实体关系抽取方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 徐芬;王挺;陈火旺;;基于SVM方法的中文实体关系抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 张苇如;孙乐;韩先培;;基于维基百科和模式聚类的实体关系抽取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 王浩畅;赵铁军;于浩;;基于文本的生物信息获取[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 甘甜;莫倩;张华平;;基于搜索引擎的人物社会关系抽取研究[A];第五届全国信息检索学术会议论文集[C];2009年
7 姚天昉;;一种用于汉语信息抽取的词汇本体[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 王智坚;李水平;包洋;李金娟;张莨;;烟叶交售排队系统的设计与分析[A];中国烟草学会2016年度优秀论文汇编—— 信息化管理主题[C];2016年
9 石志强;李涛;孙延涛;;基于以太网的宽带社区网络管理系统[A];2003年通信软件技术学术年会论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 郑巍;基于文本挖掘的生物医学实体关系抽取研究[D];大连理工大学;2018年
2 张晓峰;基于核方法的实体关系抽取研究[D];东南大学;2016年
3 赵哲焕;生物医学实体关系抽取研究[D];大连理工大学;2017年
4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
5 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
6 郭喜跃;面向开放领域文本的实体关系抽取[D];华中师范大学;2016年
7 顾静航;面向生物医学领域的实体关系抽取研究[D];苏州大学;2017年
8 张宏涛;面向生物文本的实体关系自动抽取问题研究[D];清华大学;2012年
9 陈忱;面向Web的实体关系查询与分析关键技术研究[D];东北大学;2013年
10 甘丽新;基于句法和语义分析的中文实体关系抽取[D];江西财经大学;2017年
中国硕士学位论文全文数据库 前10条
1 吴海涛;基于语义要素的网络社区文本实体关系图谱构建[D];北京邮电大学;2019年
2 佘恒;基于深度学习的中文文本实体关系抽取研究与实现[D];北京邮电大学;2019年
3 刘亚军;中文命名实体及实体关系的自动抽取研究[D];郑州大学;2019年
4 李金绘;法制领域案件的实体关系抽取研究[D];昆明理工大学;2018年
5 王宋祥;非限定类型的实体关系抽取研究[D];湖南师范大学;2018年
6 刁云澜;基于主题微博的人物实体关系提取研究[D];西华大学;2018年
7 张硕望;一种基于远程监督的中文实体关系抽取方法[D];南华大学;2018年
8 郭莉莉;藏语实体关系抽取研究[D];中央民族大学;2018年
9 赵龙一;基于浅层分析的量化关系抽取方法研究[D];湖南大学;2014年
10 唐弘毅;基于深度学习的实体关系抽取的研究[D];北京大学;2018年
中国重要报纸全文数据库 前1条
1 著名律师 高树;程序合法决定结果合法[N];深圳特区报;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978