收藏本站
《哈尔滨工业大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

文本否定范围识别技术研究及其应用

LYDIA LAZIB  
【摘要】:文本否定范围识别是信息抽取领域的一项重要任务。该任务可以为许多其他自然语言处理领域的任务提供帮助,比如情感分析、医学数据挖掘,关系抽取和问答系统等。由于否定词的使用容易将积极的表述转化成相反的意思,从而带来错误的预测和理解,因此近几年来否定范围的自动识别任务在学术界引发了广泛的关注,并存在许多亟待解决的问题。本篇博士论文中,我们将通过应用不同的机器学习方法和基于神经网络的方法,抽取句子中否定线索(即否定词)和识别出相应的否定范围(即受到否定线索影响的词语),从而来解决自然语言处理领域中否定范围识别这一前沿问题。我们重点研究如何构建一个较少依赖于手工设计的特征,同时更专注于发掘有力的否定线索与否定范围识别器的系统。进一步,我们将否定范围识别模型应用于情感分析系统中,来证实文本否定范围识别模型有利于提高情感分类的性能。我们提出了基于CRF(条件随机场)的否定线索和否定范围识别方法。该方法将研究任务转换为序列标注问题,将其分解为两个子任务,一个是否定线索识别,另一个是否定范围识别。对于每一个子任务,我们都采用CRF模型来解决。CRF模型基于从句法或上下文中提取出来的简单的特征集合来进行建模,最终基于该模型进行否定线索和否定范围识别。我们提取到的特征有能力在降低特征工程工作量的同时,保留住否定线索和否定范围中的词之间的关系信息。这种方法优于在同领域的其他所有方法。我们基于循环神经网络和词向量提出了一种新的否定范围识别方法。这个工作对比了不同循环神经网络(如:LSTM,Bi-LSTM和GRU)和其他机器学习方法(如:CRF)在否定范围识别任务上的效果。不同神经网络模型的输入是一个句子和句中所有词语的词向量表示。这个工作的创新点在于,在我们所接触到的文献中,我们是第一个将神经网络用于否定范围识别任务上。此外提出的方法的效果在SFU评论数据集上超过了现有的方法,从而证明了循环神经网络在不引入额外特征的前提下,效果远好于其他机器学习的方法。我们将之前的循环神经网络模型与卷积神经网络结合在一起来捕捉不同类型的信息,从而在不引入额外特征的前提下,提高解决否定范围识别的能力和增强神经网络模型的鲁棒性。这个方法中的循环神经网络(如,Bi-LSTM)可以自动捕捉到与句子有关的上下文特征,卷积神经网络从否定线索与待选受到影响的词中最短句法路径(如,依存关系或短语结构)上捕捉句法特征。我们提出的方法在否定范围识别任务上被证明是具有鲁棒性的,并且在生物医药领域数据上我们的方法达到了最好的效果。最后,我们将否定线索识别和否定范围识别的结果用于情感分类任务上。这个工作中,我们复现了一个基于神经网络的情感分类模型,并比较了采用传统否定词方法和采用我们提出的否定范围识别方法。结果表明否定范围识别有利于情感分类性能的提升,且我们提出的否定范围识别模型比传统的否定词识别方法更有效。
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 胡悦;;金融市场中的神经网络拐点预测法[J];金融经济;2017年18期
2 吴立可;;脉冲神经网络和行为识别[J];通讯世界;2018年12期
3 迟惠生;陈珂;;1995年世界神经网络大会述评[J];国际学术动态;1996年01期
4 王丽华;杨秀萍;王皓;高峥翔;;智能双轮平衡车的设计研究[J];数字技术与应用;2018年04期
5 张庭略;;基于硬件的神经网络加速[J];通讯世界;2018年08期
6 苏秀婷;;耦合神经网络的同步[J];绍兴文理学院学报(自然科学);2016年03期
7 朱溦;;神经网络结合平均影响值方法筛选变量[J];产业与科技论坛;2017年01期
8 ;硅光子神经网络亮相[J];石油工业计算机应用;2016年04期
9 任刚红;杜坤;周明;刘年东;张晋;;基于级联神经网络的年降雨量预测[J];土木建筑与环境工程;2016年S2期
10 金鑫;李龙威;季佳男;李祉歧;胡宇;赵永彬;;基于大数据和优化神经网络短期电力负荷预测[J];通信学报;2016年S1期
中国重要会议论文全文数据库 前10条
1 孙军田;张喆;;基于神经网络数据挖掘技术确定灾害等级的灭火救援出动力量模型研究[A];2016中国消防协会科学技术年会论文集[C];2016年
2 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
3 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
4 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
5 李涛;费树岷;;具有变时滞Cohen-Grossberg神经网络的指数稳定性准则[A];第二十六届中国控制会议论文集[C];2007年
6 汪灵枝;秦发金;;具有变时滞和脉冲的离散Cohen-Grossberg神经网络的周期解[A];中国自动化学会控制理论专业委员会D卷[C];2011年
7 韩正之;林家骏;;用神经网络求解非线性相容方程[A];1993年控制理论及其应用年会论文集[C];1993年
8 林家骏;王赞基;;求解不可微优化问题的连续极大熵神经网络[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
9 姜德宏;徐德民;任章;;基于神经网络的自校正控制器[A];1993中国控制与决策学术年会论文集[C];1993年
10 窦永丰;贝超;;模糊与神经网络结合方式及在控制中的应用[A];1997年中国控制会议论文集[C];1997年
中国重要报纸全文数据库 前10条
1 记者 刘霞;忆阻器制成神经网络更高效[N];科技日报;2017年
2 整理 本报记者 诸玲珍 顾鸿儒;微软神经网络切割法可使加速作用超线性[N];中国电子报;2018年
3 ;神经网络小史[N];电子报;2018年
4 张敏;人机大战,到底谁会赢?[N];北京日报;2017年
5 ;人工智能将取得大面积突破[N];中国企业报;2017年
6 本报记者 龚丹韵;人机大战:人类还有优势吗[N];解放日报;2017年
7 ;人类正迎来云端机器人时代[N];中国企业报;2017年
8 张斌;谁还需要“同传”[N];文汇报;2017年
9 科大讯飞董事长 刘庆峰;高考机器人考入一流大学不再是梦[N];中国教育报;2017年
10 邓洲 中国社会科学院工业经济研究所;深度学习:人工智能进入应用阶段[N];上海证券报;2017年
中国博士学位论文全文数据库 前10条
1 李一鸣;结合知识和神经网络的文本表示方法的研究[D];浙江大学;2018年
2 LYDIA LAZIB;文本否定范围识别技术研究及其应用[D];哈尔滨工业大学;2018年
3 周小强;基于深度学习的交互式问答技术研究[D];哈尔滨工业大学;2017年
4 刘梅;网络系统的稳定和同步行为研究[D];新疆大学;2017年
5 李若霞;基于忆阻的神经网络的动力学分析及应用[D];东南大学;2017年
6 项延德;基于卷积神经网络的心电信号检测和分类研究[D];浙江大学;2018年
7 孔颖;终态神经网络及其相关应用[D];浙江工业大学;2017年
8 谈宏莹;基于太赫兹时域谱物质检测技术及实验研究[D];燕山大学;2016年
9 吴森森;地理时空神经网络加权回归理论与方法研究[D];浙江大学;2018年
10 张振敏;基于脉冲神经网络的纹理图像识别研究[D];福建师范大学;2016年
中国硕士学位论文全文数据库 前10条
1 谢良才;基于BP神经网络的煤热解特性及煤灰熔融特性研究[D];西北大学;2018年
2 张旭;基于VMD-神经网络输气管道的工况分类研究[D];东北石油大学;2018年
3 孙昊;粒子群神经网络在供水管线腐蚀预测中的应用研究[D];东北石油大学;2018年
4 严寒;基于卷积神经网络的图像分类算法研究[D];西北大学;2018年
5 季静;融合多重语义对齐表示的机器阅读理解研究[D];南京师范大学;2018年
6 尹化荣;基于卷积神经网络的情感分类算法研究[D];西北大学;2018年
7 邹鑫;基于卷积神经网络的图像分类算法研究[D];西北师范大学;2018年
8 李婷玉;基于神经网络的输油管道腐蚀预测研究与实现[D];华北理工大学;2018年
9 赵士超;基于神经网络的LIBS钢水成分在线检测[D];华北理工大学;2018年
10 曹雲梦;基于BP神经网络的轨道电路故障诊断[D];华北理工大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026