收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉英机器翻译系统中的一种语义排岐模型研究

杨晓峰  
【摘要】: 本文提出了机器翻译中句法分析的一种语义排歧模型,该模型以《知网》为主要语义知识源,从“制约”与“优选”两个角度同时进行词义及结构的排歧:“制约”是在分析规则中对产生的结果进行约束,而“优选”则是从若干个已分析出的侯选结构中根据某种选择原则挑出一个最优的结构。 在句法分析过程中进行的“约束”语义排歧的主要思想是在句法分析的规则中调用一个评价函数,该函数把当前待归约产生式中各个子成分的搭配情况与模式库中的各搭配结构进行匹配运算,并返回最相似的匹配结果及对应的评价值。分析规则根据此评价值来决定当前的产生式是否能够成功地归约,从而减少分析器产生的歧义结果数量。本文定义了搭配规则的结构模式,并给出了模式匹配的主要算法。 从基于优选的角度对分析生成的中间语言进行排歧处理是本文的论述重点。排歧模型首先利用大规模的语料库获取义原的同现集合,并根据转换模板构造出义原的初始限制规则,再通过手工的方式对初始规则进行修改与调整,以得到一个较完善的规则集。义项的语义限制规则可以由其构成义原的语义规则得到。将此规则与义项所在的语义环境进行相似度的计算,并根据计算结果进行义项选择和结构的语义搭配的评价,从而进行词义排歧与结构排歧及语义结构调整, 本文所提出的语义排歧模型已在机器翻译系统中具体地实现。实验例句的测试表明该排歧模型对解决句法分析中的词汇歧义、结构歧义是有效的。本文共分为五章。 第一章是绪论。简要地说明语义分析的重要性及语义分析的发展情况,从中引出了语义分析中一个研究领域——语义排歧。这一章讨论了中文文本分析的歧义消解问题,并对当前通用的排歧方法做了简要的介绍。最后该章提出了本文的主要工作要点。 第二章介绍了排歧模型的总体思想,并简要介绍了《知网》、分析规则、中间语言等一些必要知识。 第三章主要介绍在句法分析过程中利用约束进行的语义排歧方法,详细介绍了搭配规则的定义,义原相似度计算、模式匹配相似度计算、词义选择及结构选择等算法步骤。 第四章主要介绍了针对中间语言进行的优选语义排歧的方法,详细地给出了义原同现集合的统计、限制规则的生成、语义环境的确定、义项的评价、词义的选择及结构的排歧、语义结构调整等一系列算法。 第五章总结了本文的主要工作,给出了本文的结论,并提出进一步工作的设想。另外,附录给出了部分歧义短语和句型的排歧结果。


知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978