收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于核方法的语义角色标注研究

车万翔  
【摘要】: 全自动的语义分析一直是自然语言理解的主要任务之一。通过深层语义分析,可以将自然语言转化为形式语言,从而使计算机能够与人类无障碍的沟通。为达此目的,人们已经进行了多年的努力,然而由于这一问题过于复杂,目前取得的效果并不理想。浅层语义分析是对深层语义分析的一种简化,它只标注与句子中谓词有关的成分的语义角色,如施事、受事、时间和地点等。其能够对问答系统、信息抽取和机器翻译等应用产生推动作用。语义角色标注是浅层语义分析的一种实现方式,具有定义清晰,便于评价的优点,近年来受到越来越多学者的关注。 目前主流的语义角色标注研究集中于使用各种统计机器学习技术,利用多种语言学特征,进行语义角色的识别和分类。近年的研究表明,影响语义角色标注系统性能的首要因素并非机器学习模型,而是使用的特征。因此,若想提高系统的性能,细致的特征工程工作是必不可少的。然而,随着越来越多特征的加入,特征之间的相互影响越来越严重,使得系统性能增长的趋势逐渐趋缓,并达到一个上限。为此必须寻找新的方法以解决这一问题。 基于核的方法通过对已有特征进行组合或者分解,将低维特征空间映射到高维特征空间,从而将在低维空间不容易区分的问题在高维空间加以解决,是一种可行的解决方案。 本文正是利用核方法这一优点,将其应用于语义角色标注这一问题中。除了使用已有的核方法外,还提出了多种新的核方法。 首先,我们构造了一个语义角色标注基线系统,该系统使用特征向量表示待分类对象,并在特征向量之上,使用基于多项式核的方法,自动的对特征进行组合。实验结果表明,当使用二次多项式核对特征进行两两组合时,该系统是目前已知的最好的基于单句法分析器的语义角色标注系统之一。 接着,我们针对基线系统中,特征向量很难恰当的表示结构化的特征这一问题,使用了卷积树核自动将较大的结构特征进行分解,并能够在多项式时间内进行核函数的计算。然而,通常的卷积树核混淆了语义角色标注中不同的特征,因此,我们提出了混合卷积树核融合多种树核,来对不同种类的特征分别进行建模,最终获得优于标准卷积树核的性能。然后将混合卷积树核与二次多项式核进行融合,得到的复合核取得了比单独使用两种核都好的结果。 但是,标准卷积树核要求两棵子树之间必须是精确匹配的,而不考虑结构相似,语义角色相同的情况。因此,我们提出了新的句法驱动卷积树核,在核函数的设计过程中,融入了语言学知识,容许结构和节点的近似匹配,最终取得了较标准卷积树更好的性能。最后同样与多项式核进行融合,并取得了更好的性能。 最后,我们使用基于核的方法,实现了一个目前最好的中文语义角色标注系统。主要贡献在于提出了更适用于中文的新特征,同时首次将核方法应用于中文语义角色标注中,得到了与英文相同的性能趋势,从而也证明了我们提出的核方法的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王红玲;袁晓虹;王步康;周国栋;;依存关系上的中文名词性谓词识别研究[J];计算机工程与应用;2011年20期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 车万翔;刘挺;李生;;语义角色标注的方法与挑战[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 冯娟娟;李晗静;李生;;基于句法分析的中文语义角色标注实现[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 车万翔;刘挺;李生;;自动浅层语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 汪红林;丁金涛;王红玲;周国栋;;基于依存关系的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 车万翔;刘挺;李生;;浅层语义分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 刘娜;王小捷;;两类中文特殊句式的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
7 郝志新;王轩;李露;范士喜;;基于句法依存关系的语义角色标注[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 袁晓虹;王步康;王红玲;周国栋;;基于依存关系的中文谓词标注研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 王步康;王红玲;袁晓虹;周国栋;;基于依存句法分析的中文语义角色标注[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 毕玉德;陈洁;吕春燕;;朝鲜语句子语义角色标注研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前2条
1 车万翔;基于核方法的语义角色标注研究[D];哈尔滨工业大学;2008年
2 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年
中国硕士学位论文全文数据库 前10条
1 赵纪元;面向文景转换的中文语义角色标注研究[D];哈尔滨工业大学;2007年
2 汪红林;基于依存分析的语义角色标注研究[D];苏州大学;2009年
3 张祎挺;语义角色标注及其在句子相似度计算上的应用[D];北京邮电大学;2008年
4 蔡洁;中文子句语义角色标注系统实现研究[D];北京邮电大学;2008年
5 罗思明;基于语义相似度的汉语未登录动词语义框架识别[D];北京邮电大学;2008年
6 张国华;汉语框架语义角色自动标注研究[D];山西大学;2008年
7 安强强;基于语义角色标注的中文问答系统研究[D];西北大学;2009年
8 郭文;基于格框架的机器翻译[D];厦门大学;2009年
9 谭伟;面向网络的中文问答系统相关技术的研究与系统初步实现[D];清华大学;2005年
10 陈丽江;汉语真实文本的语义角色标注[D];南京师范大学;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978