收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文句法语义分析及其联合学习机制研究

李军辉  
【摘要】: 作为自然语言处理的一个研究重点,语义分析旨在将人类的自然语言转化为计算机能够理解的形式化语言。由于深层语义分析的复杂性,人们目前更关心浅层语义分析,即分析句子中谓词(可以是动词或名词等)的语义角色成分,包括施事者、受事者、时间、地点等。作为浅层语义分析的一种实现方式,语义角色标注(Semantic Role Labeling,简称SRL)已被广泛应用于自然语言处理相关任务,如信息抽取、问答系统和机器翻译等。根据谓词词性的不同,通常可以将SRL分为动词性谓词SRL和名词性谓词SRL。 目前主流的SRL研究集中于在给定句法树的条件下,使用各种统计机器学习技术,采用基于特征向量或基于树核函数的方法,进行语义角色的识别和分类。近年来的研究表明,SRL的性能严重依赖于句法分析的性能,同时名词性谓词SRL性能远低于动词性谓词SRL性能。以上两个问题在中文SRL研究中尤其突出,例如,在中文PropBank和中文NomBank的相关实验表明,基于正确句法树和正确谓词,动(名)词性谓词SRL性能F1值可以达到92(70),而基于自动句法分析F1值下降为67(57)。本文以句法和语义的联合分析为研究目标,研究新颖的句法分析模型和动/名词性谓词SRL,并重点探索两者之间的联合学习机制,推进SRL的实用化进程。 主要研究内容包括: 1.句法分析的研究。提出了层次句法分析模型,为实现句法分析和SRL的联合学习提供了强有力的基础。该模型将句法分析分解为三个子任务:词性标注、基本短语识别和复杂短语识别,自底向上进行,其基本思想是:在每层处理过程中,优先识别出容易识别的组块,这样就能提供更丰富的上下文信息进行复杂组块识别;未被合并的组块和新识别产生的组块共同构成下步处理的输入,重复此过程直至识别出根结点。 2. SRL的研究。首先系统研究了中文动词性谓词SRL,重点探索了如何从句法树中抽取出各种平面特征和结构化特征。其次,深入研究了中文名词性谓词SRL,从两个角度探索了中文动词性谓词SRL对中文名词性谓词SRL的影响:训练实例的扩充和动词性谓词SRL特征的应用,显著地提高了名词性谓词SRL性能。最后,研究了中文名词性谓词的自动识别问题。实验表明,本文取得的动(名)词谓词SRL性能优于其他同类型系统。 3.句法分析和SRL的联合学习机制研究。主要从两个层次探索了句法分析和SRL的联合学习:第一,提出了一种联合学习方案,将SRL嵌入到基于层次句法分析模型的句法分析过程中,实现两者的同步执行;第二,将由SRL得到的语义信息集成到层次句法分析模型中,更好地指导句法分析。实验表明,该联合学习方案不仅缓解了SRL对句法分析结果的严重依赖,而且能够提高两者的性能,特别是SRL的性能。 本文的创新点主要表现在:提出了层次句法分析模型,该模型不仅取得较好的性能,而且具备良好的可扩充性,能够有效集成其他自然语言处理任务;提出了利用动词性谓词SRL生成的有效特征来辅助名词性谓词SRL;提出了一种有效的句法分析和SRL的联合学习机制,减少SRL对句法分析的依赖。实验表明,这些研究大大提高了SRL的性能,减轻了SRL对句法分析的依赖,对今后SRL的研究具有重要的参考价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵静;;句法分析模块论及句法分析策略对花园路径现象的解释[J];湖北经济学院学报(人文社会科学版);2012年09期
2 玉素甫·艾白都拉,吾守尔·斯拉木;维语中心语驱动文法句法分析器中的上下文相关处理[J];计算机应用与软件;1999年06期
3 张益民,陈玉泉,陆汝占;一种可训练的快速汉语部分句法分析方法[J];软件学报;2000年11期
4 玉素甫·艾白都拉;维语句法分析器中的词义排歧问题的研究[J];计算机应用与软件;2002年04期
5 孟遥,李生,赵铁军,曹海龙;四种基本统计句法分析模型在汉语句法分析中的性能比较[J];中文信息学报;2003年03期
6 邹加棋;带有误差上限的句法分析方法[J];福建电脑;2003年12期
7 李向宏,王丁,黄成哲,雷国华;自然语言句法分析研究现状和发展趋势[J];微处理机;2003年02期
8 孟遥;李生;赵铁军;杨沐昀;;基于统计的句法分析技术综述[J];计算机科学;2003年09期
9 徐健,张辉,蔡劲松;一种现代汉语句法分析方法的建立与实现[J];计算机应用与软件;2004年01期
10 陈晓明,周渝;汉语部分句法分析的研究和发展趋势[J];贵州大学学报(自然科学版);2004年04期
11 陈晓辉;周源远;袁春风;武港山;;一种有效的汉语概率句法分析算法[J];计算机应用研究;2006年01期
12 李幸;宗成庆;;引入标点处理的层次化汉语长句句法分析方法[J];中文信息学报;2006年04期
13 冀铁亮;穗志方;;词汇化句法分析与子语类框架获取的互动方法[J];中文信息学报;2007年01期
14 段湘煜;赵军;徐波;;基于动作建模的中文依存句法分析[J];中文信息学报;2007年05期
15 张小艳;邵刚;史月飞;;汉语句法分析中标点符号的运用[J];计算机工程与科学;2009年01期
16 刘海涛;赵怿怡;;基于树库的汉语依存句法分析[J];模式识别与人工智能;2009年01期
17 袁里驰;;基于词聚类的依存句法分析[J];中南大学学报(自然科学版);2011年07期
18 王卫平;孟翠翠;;基于句法分析与依存分析的评价对象抽取[J];计算机系统应用;2011年08期
19 袁里驰;;融合语言知识的统计句法分析[J];中南大学学报(自然科学版);2012年03期
20 马骥;朱慕华;肖桐;朱靖波;;面向移进—归约句法分析器的单模型系统整合算法[J];中文信息学报;2012年03期
中国重要会议论文全文数据库 前10条
1 李正华;车万翔;刘挺;;基于柱状搜索的高阶依存句法分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 李军辉;周国栋;朱巧明;钱培德;;一种改进的中文层次句法分析模型研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
4 冀铁亮;穗志方;;词汇化概率句法分析与动词子语类框架获取的互动方法[A];第三届学生计算语言学研讨会论文集[C];2006年
5 孙俊;曹海龙;赵铁军;;面向句法分析的样本选择[A];第三届学生计算语言学研讨会论文集[C];2006年
6 刘海涛;;影响依存句法分析的因素探讨[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 马骥;朱慕华;肖桐;朱靖波;;面向移进-归约句法分析器的单模型系统融合算法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 庞文斌;张国煊;曹恬;;基于规则和统计的汉语浅层句法分析的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 孙宏林;俞士汶;;浅层句法分析方法概述[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
10 段湘煜;赵军;徐波;;基于动作建模的中文依存句法分析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 朱慕华;基于多数据源的成分句法分析研究[D];东北大学;2013年
2 马骥;面向依存句法分析优化技术的研究[D];东北大学;2015年
3 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
4 李正华;汉语依存句法分析关键技术研究[D];哈尔滨工业大学;2013年
5 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
6 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
7 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
8 冯秋香;基于数据库语义学的古汉语句法语义分析研究[D];大连理工大学;2012年
9 田卫新;产品评论检索若干关键技术研究[D];武汉大学;2010年
10 林锋;问题回答和对话系统中置信度的研究[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 王蕾;基于统计方法的汉语长句依存句法分析[D];中国海洋大学;2009年
2 李静毅;基于CVG模型的中文短语结构句法分析研究[D];郑州大学;2015年
3 任彬;基于微博的用户饮食特色及表达习惯分析[D];哈尔滨工业大学;2015年
4 吴双志;语音翻译中口语文本规范化的研究[D];哈尔滨工业大学;2015年
5 杨振鹏;中文多词表达抽取及其在依存句法分析中的应用[D];南京师范大学;2015年
6 吴雨;基于深层句法分析与领域知识的生物事件抽取[D];大连理工大学;2015年
7 杨彬;多层级情感分析系统的研究与实现[D];电子科技大学;2014年
8 赵建双;基于树库的中文依存句法分析的研究[D];复旦大学;2013年
9 张书卿;基于核心句和句法分析的微博情感倾向性分析[D];南华大学;2015年
10 周营;基于句模与句法分析的事件抽取研究[D];广西师范大学;2015年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978