基于语义语言的机器翻译系统中若干关键问题研究
【摘要】:
时至今日,全自动高质量的机器翻译系统仍未出现,其原因在于语言知识的复杂性和人类认识语言规律的有限性。目前,机器翻译的研究已不局限于对单个句子的句法语义分析,更要充分挖掘语言内部规律并深入探讨包括句群、段落、篇章、体裁在内的各种语境信息。基于语义语言的多语言机器翻译方法根据语义单元库对源语言句子进行语义分析,并展开为目标语言句子来实现翻译。该机器翻译系统由两部分组成:一是统一的多自然语言机器翻译软件;另一是高质量、可扩充、完备的、无可弃、无重复、无非正常歧义的多语统一语义单元库。但是受所提取语料限制和语言现象复杂多变的影响,现有语义单元库并不完备(语义单元及其表示不全或不正确),无法保证所有句子都能翻译且结果正确。另外目前该系统中仍存在一些难点重点问题亟待解决。为了提高翻译质量,得到正确且无语无伦次的译文,本文针对系统中存在的其中三类关键问题进行了一系列的研究,主要包括如下三个方面:
(1)研究了基于语义语言的机器翻译系统中的关键问题之一:量词。
首先在统一语言学语义单元理论的基础上,对英、汉名量词进行统一分类,即量词在英语和汉语中的不同语义单元表示对应相同的量词语义类型;然后基于语义单元理论将名量短语形式化成汉语和英语语义单元表;最后利用《知网》的词汇定义对形式量词搭配的名词进行语义表示,并建立形式量词-名词搭配规则库,提出并实现了一种基于规则库和名词实例的系统中汉语形式量词选择方法。
(2)研究了基于语义语言的机器翻译系统中的关键问题之二:英语介词的语义消歧和汉译。
首先基于语义单元理论并针对含介词的短语和句子特点,构建了介词特有语义单元(表示)库——介词语义模式库。介词的翻译由两步来实现:第一步基于语义模式库对英语含介词的短语和句子进行语义分析得到英语完整语义模式;第二步基于语义模式库将英语完整语义模式代入展开成为汉语完整语义模式和汉语译文。最后在语义分析阶段提出三种介词特有的语义分析方法。第一种方法是基于连接文法和语义模式法:建立含介词的短语和句子与连接因子对应关系,将连接文法分析器对句子识别结果与其相匹配获取句子语法结构。第二种方法是语义模式分解法:将含介词的短语和句子的四种基本形式分解得到介词简单语义模式。第三种方法是语义模式扩展法:从介词开始向左向右逐层扩展动词、名词和形容词得到实际扩展形式。实验结果验证了介词语义模式库和语义分析三种方法对处理基于语义语言的机器翻译系统中的介词语义分析和汉译是有效的。
(3)研究了基于语义语言的机器翻译系统中的关键问题之三:汉英时态转换。
首先在分析汉英双语句对和归纳汉语句子时间表达规律基础上,从英语16种时态向汉语时间表达的逆向映射关系出发,对汉语句子时间信息进行新分类,该分类方法有效地避免传统时态分类的复杂性和类别交叉等缺点:然后提出时间模式的相关概念,用其对每类时间信息进行形式化,并构建了时间信息模式库;最后提出了一种将汉语单句时间分析算法、汉语关联词语标记句时间分析算法、类虚拟语气句时间分析算法与篇章信息识别规则相结合的多策略汉语句子时间分析和英译方法,为基于语义语言的机器翻译系统提供了一种可行的时态转换方法。
|
|
|
|
1 |
郑于时;;高晓松引发的议论[J];咬文嚼字;2011年07期 |
2 |
陈林森;;“堂堂一介外相”?[J];咬文嚼字;2011年07期 |
3 |
李丽慧;;“每位弱势群体”?[J];咬文嚼字;2011年09期 |
4 |
;[J];;年期 |
5 |
;[J];;年期 |
6 |
;[J];;年期 |
7 |
;[J];;年期 |
8 |
;[J];;年期 |
9 |
;[J];;年期 |
10 |
;[J];;年期 |
11 |
;[J];;年期 |
12 |
;[J];;年期 |
13 |
;[J];;年期 |
14 |
;[J];;年期 |
15 |
;[J];;年期 |
16 |
;[J];;年期 |
17 |
;[J];;年期 |
18 |
;[J];;年期 |
19 |
;[J];;年期 |
20 |
;[J];;年期 |
|