收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于依存关系的中文语义角色标注研究

袁晓虹  
【摘要】: 作为自然语言理解的一项研究重点,语义分析旨在将人类的自然语言转化为计算机能够理解的形式化语言。由于深层语义分析的复杂性,人们目前更关心浅层语义分析,一种简化了的语义分析形式,分析句子中谓词(动词或名词)的语义角色成分,包括施事者、受事者、时间、地点等。作为浅层语义分析的一种实现方式,语义角色标注(Semantic Role Labeling,简称SRL)已被广泛应用于更高层次的自然语言处理相关任务,如信息抽取、问答系统和机器翻译等。根据谓词词性的不同,通常可以将语义角色标注分为动词性谓词语义角色标注和名词性谓词语义角色标注。 目前主流的语义角色标注研究都是基于短语结构句法分析进行的,并取得了一定的成果。但这种研究方案中,短语句法分析性能对语义角色标注性能起着主导作用,是现阶段语义角色标注的瓶颈。因此有研究者开始探索使用依存句法分析进行语义角色标注。另从研究现状看,针对中文语义角色标注的研究要比英文的少得多,其中一个主要原因是缺乏合适的标注语料。现阶段由于中文PropBank和中文NomBank的发布,使得对中文语义角色标注的研究成为可能。因此,本文从依存关系出发,研究中文语义角色标注,主要研究内容有以下三个方面: 首先,探索了中文谓词标注,包括动词性谓词和名词性谓词。谓词标注是语义角色标注的前提,是语义角色标注中的重要一步,其性能直接决定了语义角色标注的性能。针对动词性谓词,本文实现了一个基于最大熵分类器的识别系统,并在CoNLL2008和CoNLL2009评测数据上进行实验;对名词性谓词的识别,除了采用基于最大熵分类器外,还采用了基于卷积树核的方法,并在中文NomBank的转换语料上进行实验。 其次,研究了基于特征向量的中文SRL。在构建一个通用的基于特征向量的中文语义角色标注平台的基础上,重点探讨了特征选择对系统性能的影响,并分别针对动词性谓词和名词性谓词制定不同的特征集合,分析各个特征对系统的贡献度。实验结果表明,系统在中文名词性谓词上的P/R/F1值分别为:71.37/86.20/78.09。最后,首次尝试采用基于卷积树核的方法对名词性谓词进行语义角色标注。其中重点讨论了依存树的构造和剪枝,探索在结构信息本身就很少的依存树上,使得输入的树中尽量少的包含噪音信息。实验表明,基于树核函数的SRL结果与基于特征向量的结果已经非常接近。本实验作为基于卷积树核的探索性实验,为今后研究提供了有价值的参考。 本文的主要贡献在于对基于依存关系的中文语义角色标注进行了全面研究,包括使用不同方法识别动词和名词性谓词;使用基于特征向量的方法构建语义角色标注平台,分析各个特征的作用;并首次使用基于核函数的方法进行中文语义角色标注。这些方法的研究及取得的成果对今后的研究具有重要的参考价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陶明忠;马玉蕾;;框架网络与汉语信息处理[J];语言文字应用;2007年04期
2 贾君枝;赵文娟;王东元;;汉语框架网络知识库的语义角色特征识别[J];图书情报工作;2009年17期
3 周明海;亢世勇;刘金凤;;面向信息处理的大规模句子语义知识库研究述要[J];当代外语研究;2011年10期
4 李良富,樊孝忠,李宏乔;语义相似计算驱动领域自动问答[J];北京理工大学学报;2005年11期
5 杨选选;张蕾;;基于语义角色和概念图的信息抽取模型[J];计算机应用;2010年02期
6 赵文娟;闫红梅;王蔚林;;基于汉语框架网的语义角色标注算法[J];图书情报工作;2011年06期
7 刘焘;贾君枝;;中文信息处理中的语义关系表示探析[J];现代图书情报技术;2006年10期
8 董振东;董强;郝长伶;;知网的理论发现[J];中文信息学报;2007年04期
9 王海东;胡乃全;孔芳;周国栋;;指代消解中语义角色特征的研究[J];中文信息学报;2009年01期
10 袁毓林;;语义角色的精细等级及其在信息处理中的应用[J];中文信息学报;2007年04期
11 石晶;李万龙;;汉语语义分析方法研究[J];计算机应用研究;2010年02期
12 张志昌;张宇;刘挺;李生;;基于话题和修辞识别的阅读理解why型问题回答[J];计算机研究与发展;2011年02期
13 由丽萍;秦雅楠;董文博;裴夏璇;;框架与Petri网相结合的中文情境知识表示方法研究[J];情报理论与实践;2011年03期
14 许荣华;吴刚;李培峰;朱巧明;;基于指代消解的中文事件融合方法[J];计算机应用;2009年08期
15 李正华;车万翔;刘挺;;基于柱搜索的高阶依存句法分析[J];中文信息学报;2010年01期
16 齐璇;陈火旺;;ICENT汉英机译系统中的语义模型[J];计算机科学;2002年01期
17 张志昌;张宇;刘挺;李生;;基于浅层语义树核的阅读理解答案句抽取[J];中文信息学报;2008年01期
18 袁毓林;;面向信息检索系统的语义资源规划[J];语言科学;2008年01期
19 张晓孪;王西锋;李乃乾;;中文问答系统中问题理解的研究与实现[J];西华大学学报(自然科学版);2008年02期
20 朱倩;程显毅;韩飞;;汉语句子语义三维表示模型[J];智能系统学报;2009年02期
中国重要会议论文全文数据库 前10条
1 王步康;王红玲;袁晓虹;周国栋;;基于树核函数的中文语义角色标注研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 杨敏;常宝宝;;基于北大网库的语义角色分类[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 王鑫;穗志方;李芸;;基于依存树距离的语义角色识别方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 吾买尔江·库尔班;阿里甫·库尔班;;维吾尔语框架语义知识库语义角色描述体系研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 周明海;亢世勇;;语义角色句法实现的词汇语义制约信息库的建设及其应用[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 王荣洋;鞠久朋;李寿山;周国栋;;基于CRFs的评价对象抽取特征研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 李琳;毕玉德;陈洁;;朝鲜语对格的语义角色分析[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 王鑫;孙薇薇;穗志方;;基于浅层句法分析的中文语义角色标注研究[A];第六届全国信息检索学术会议论文集[C];2010年
9 殷国光;华建光;;《庄子》动词配价研究[A];和谐社会:社会建设与改革创新——2007学术前沿论丛(下卷)[C];2007年
10 范开泰;由丽萍;刘开瑛;;汉语框架语义分析系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 李济洪;汉语框架语义角色的自动标注技术研究[D];山西大学;2010年
2 张占山;语义角色视角下的谓词同义词辨析[D];厦门大学;2006年
3 孔芳;指代消解关键问题研究[D];苏州大学;2009年
4 权震红;韩国语非叙述性名词配价研究[D];延边大学;2007年
5 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
6 张志昌;开放域阅读理解关键技术研究[D];哈尔滨工业大学;2010年
7 周日安;名名组合的句法语义研究[D];暨南大学;2007年
8 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
9 潘泰;现代汉语移动义动词的句法语义研究[D];华中师范大学;2009年
10 李茹;汉语句子框架语义结构分析技术研究[D];山西大学;2012年
中国硕士学位论文全文数据库 前10条
1 袁晓虹;基于依存关系的中文语义角色标注研究[D];苏州大学;2010年
2 颜廷义;基于条件场的语义角色标注[D];北京邮电大学;2010年
3 吴方磊;基于树核方法的中文语义角色标注研究[D];苏州大学;2011年
4 朱译翔;中文名词性谓词的语义角色标注研究[D];苏州大学;2011年
5 路青;基于特征选择的中文语义角色标注研究[D];曲阜师范大学;2012年
6 白雪;基于结构学习的语义角色标注[D];北京邮电大学;2010年
7 徐靖;基于特征的中文名词性谓词语义角色标注研究[D];苏州大学;2011年
8 王文学;基于联合方法的中文语义角色标注研究[D];上海交通大学;2012年
9 彭洪保;基于汉语框架网的问句语义角色标注研究[D];山西大学;2010年
10 张超辉;中文复杂句语义角色标注[D];北京邮电大学;2010年
中国重要报纸全文数据库 前10条
1 张海桐;用中文把歌剧唱出来[N];人民日报海外版;2011年
2 张伟城;中文热持续升温[N];人民日报海外版;2009年
3 朱珉迕;说中文和“拌洋荤”[N];解放日报;2009年
4 本报驻巴黎记者 姚立;“中文热”在法升温速度令人始料不及[N];光明日报;2010年
5 刘菲;关注特殊的学中文群体[N];人民日报海外版;2011年
6 晓阳;《选报》落户起点中文网[N];中华新闻报;2009年
7 记者钟哲 通讯员李世举;合编首部“民族版”高校中文教材[N];中国社会科学报;2010年
8 ;中文在线 “九死一生”的出版经历[N];电脑报;2010年
9 ;“汉语桥”世界大学生中文比赛举行[N];人民日报;2011年
10 记者 仇国强 通讯员 赵红蓉;苏丹雇员掀起学中文热潮[N];中国石化报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978