收藏本站
收藏 | 论文排版

基于语义语言的机器翻译系统中若干关键问题研究

关晓薇  
【摘要】: 时至今日,全自动高质量的机器翻译系统仍未出现,其原因在于语言知识的复杂性和人类认识语言规律的有限性。目前,机器翻译的研究已不局限于对单个句子的句法语义分析,更要充分挖掘语言内部规律并深入探讨包括句群、段落、篇章、体裁在内的各种语境信息。基于语义语言的多语言机器翻译方法根据语义单元库对源语言句子进行语义分析,并展开为目标语言句子来实现翻译。该机器翻译系统由两部分组成:一是统一的多自然语言机器翻译软件;另一是高质量、可扩充、完备的、无可弃、无重复、无非正常歧义的多语统一语义单元库。但是受所提取语料限制和语言现象复杂多变的影响,现有语义单元库并不完备(语义单元及其表示不全或不正确),无法保证所有句子都能翻译且结果正确。另外目前该系统中仍存在一些难点重点问题亟待解决。为了提高翻译质量,得到正确且无语无伦次的译文,本文针对系统中存在的其中三类关键问题进行了一系列的研究,主要包括如下三个方面: (1)研究了基于语义语言的机器翻译系统中的关键问题之一:量词。 首先在统一语言学语义单元理论的基础上,对英、汉名量词进行统一分类,即量词在英语和汉语中的不同语义单元表示对应相同的量词语义类型;然后基于语义单元理论将名量短语形式化成汉语和英语语义单元表;最后利用《知网》的词汇定义对形式量词搭配的名词进行语义表示,并建立形式量词-名词搭配规则库,提出并实现了一种基于规则库和名词实例的系统中汉语形式量词选择方法。 (2)研究了基于语义语言的机器翻译系统中的关键问题之二:英语介词的语义消歧和汉译。 首先基于语义单元理论并针对含介词的短语和句子特点,构建了介词特有语义单元(表示)库——介词语义模式库。介词的翻译由两步来实现:第一步基于语义模式库对英语含介词的短语和句子进行语义分析得到英语完整语义模式;第二步基于语义模式库将英语完整语义模式代入展开成为汉语完整语义模式和汉语译文。最后在语义分析阶段提出三种介词特有的语义分析方法。第一种方法是基于连接文法和语义模式法:建立含介词的短语和句子与连接因子对应关系,将连接文法分析器对句子识别结果与其相匹配获取句子语法结构。第二种方法是语义模式分解法:将含介词的短语和句子的四种基本形式分解得到介词简单语义模式。第三种方法是语义模式扩展法:从介词开始向左向右逐层扩展动词、名词和形容词得到实际扩展形式。实验结果验证了介词语义模式库和语义分析三种方法对处理基于语义语言的机器翻译系统中的介词语义分析和汉译是有效的。 (3)研究了基于语义语言的机器翻译系统中的关键问题之三:汉英时态转换。 首先在分析汉英双语句对和归纳汉语句子时间表达规律基础上,从英语16种时态向汉语时间表达的逆向映射关系出发,对汉语句子时间信息进行新分类,该分类方法有效地避免传统时态分类的复杂性和类别交叉等缺点:然后提出时间模式的相关概念,用其对每类时间信息进行形式化,并构建了时间信息模式库;最后提出了一种将汉语单句时间分析算法、汉语关联词语标记句时间分析算法、类虚拟语气句时间分析算法与篇章信息识别规则相结合的多策略汉语句子时间分析和英译方法,为基于语义语言的机器翻译系统提供了一种可行的时态转换方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郑于时;;高晓松引发的议论[J];咬文嚼字;2011年07期
2 陈林森;;“堂堂一介外相”?[J];咬文嚼字;2011年07期
3 李丽慧;;“每位弱势群体”?[J];咬文嚼字;2011年09期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 陈绂;;《颜氏家训》量词研究[A];中国训诂学研究会2010年学术年会论文摘要集[C];2010年
2 盖兴之;丁志磊;;彝缅语量词的共时分析[A];中国民族语言学会第10届学术讨论会摘要集[C];2010年
3 许璟明;;量词的审美情趣——“一峰骆驼”引发的思考[A];江苏省教育学会2006年年会论文集(文科专辑)[C];2006年
4 王安琛;;重叠式动补短语的句法语义分析[A];江西省语言学会2006年年会论文集[C];2006年
5 彭媛;;对外汉语量词教学探索——以量词“串”为例[A];中国英汉语比较研究会第八次全国学术研讨会论文摘要汇编[C];2008年
6 王安琛;;试论“V—V”结构[A];江西省语言学会2006年年会论文集[C];2006年
7 林国栋;;科技出版中量和单位疑难问题探讨[A];学报编辑论丛(第十四集)[C];2006年
8 王萌;俞士汶;段慧明;孙薇薇;;基于语料统计的现代汉语量名搭配研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 王萌;贾玉祥;俞士汶;;基于语料统计的量词对名词语义选择倾向的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 李昕;朱永盛 ;武港山;;论坛消息语义结构的提取与分析[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 步连增;语言类型学视野下的汉语量词研究[D];山东大学;2011年
2 关晓薇;基于语义语言的机器翻译系统中若干关键问题研究[D];大连理工大学;2009年
3 李宗澈;《史记》量词研究[D];复旦大学;2004年
4 樊中元;现代汉语一名多量现象研究[D];湖南师范大学;2003年
5 汪祎;中古佛典量词研究[D];南京师范大学;2008年
6 方淼;语义单元自动获取研究[D];大连理工大学;2008年
7 刘柏威;俄汉语量范畴研究[D];黑龙江大学;2006年
8 黄芳;先秦汉语量范畴研究[D];华中科技大学;2010年
9 张雷;黎语志强话参考语法[D];南开大学;2010年
10 刘全;基于tableau的自动推理研究[D];吉林大学;2004年
中国硕士学位论文全文数据库 前10条
1 孙欣;明代四大传奇量词研究[D];广西师范大学;2004年
2 吴文婷;“一+量词+中心语”结构研究[D];南京林业大学;2010年
3 马芳;《三国志》量词研究[D];山东师范大学;2003年
4 崔尔胜;《水浒全传》量词研究[D];广西大学;2003年
5 周丽颖;名词与量词关系考察[D];广西大学;2004年
6 李翼;汉语配对量词与英语配对单位词的范畴化及其对比研究[D];广西师范大学;2010年
7 曲凤霞;对外汉语量词教学初探[D];辽宁师范大学;2002年
8 孙丽娟;语段理论框架下对量词的句法研究[D];华南理工大学;2010年
9 周希全;“数+形+量”格式研究[D];上海师范大学;2010年
10 游黎;唐五代量词研究[D];四川大学;2002年
中国重要报纸全文数据库 前10条
1 深圳 吴碧辉;教幼儿学量词[N];中国教育资讯报;2002年
2 格蒂;改变习惯——量词营销的较“量”[N];医药经济报;2003年
3 本报特约记者 戴铮;辞典成了日本畅销书[N];中华读书报;2005年
4 刘永耕;量词“样”跟“种”的区别[N];语言文字周报;2007年
5 张建伟;说“枚”论“种”[N];中国集邮报;2005年
6 《语言文字报》原主编 杜永道;“百十人”是多少人?[N];人民日报海外版;2011年
7 王一民;可以说“1.6万多”吗?[N];语言文字周报;2010年
8 ;全国优秀童谣评选结果揭晓[N];人民日报;2009年
9 张汝清;把握中英文的不同之处[N];人民日报海外版;2001年
10 聂远高;巧用智能ABC输入特殊符号[N];中国税务报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978