收藏本站
《广西师范大学》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

英汉机器翻译中的歧义及消歧策略

叶君梅  
【摘要】: 在当今这个全球经济一体化、信息爆炸的时代,特别是在中国加入世贸组织后,国内外的科技文化信息的交流如汹涌的潮水势不可挡。Internet的迅速普及,使信息传播突破了国界的限制,但语言差异却成了信息交流的最大障碍。传统的人工翻译已不能满足要求,人们渴望发展自然语言信息处理技术以能快速、有效地解决海量信息的翻译问题,机器翻译就是解决这个难题的最好的办法。 机器翻译的确切定义是用计算机把一种语言全自动翻译为另一种语言。机器翻译研究的意义是不言而喻的,但又是一项艰巨的研究课题。自二十世纪四十年代美国为获取情报而首次开发出机器翻译技术以来,机器翻译已有六十余年的发展历史,其间经历了几起几落的曲折历程。人们对它的评价毁誉参有。尽管二十世纪九十年代以来,已有许多机器翻译系统进入了市场,但其翻译结果却不尽如人意。由于计算机本身固有的特点及语言学、算法的不够完善,机器翻译系统面临的主要瓶颈之一就是语言歧义消解问题。本文研究英汉机器翻译中的歧义现象,在总结前人经验和个人研究(调试北京中文信息处理开放实验室的“译路通”英汉系统)的基础上,提出了一些可行的消歧策略。 机器翻译的设计一直是尽可能地模仿人的翻译原理。本文的第二部分介绍了机器翻译系统的历史、现状和原理。一个译者必须具备双语词汇,双语语法知识、客观经验知识及对上下文已合信息的判断能力。机器翻译系统则包括词典或语料库和翻译引擎两部分。翻译引擎一般又包括三大模块:词法分析、句法分析、转换生成模块。其中句法分析模块主要是基于短语结构语法和语言递归性原理,用逻辑编程语言表述成的一整套规则,经过这些句法规则判断,得出句法树。本文还分析了生成模块的生成转换过程。 从机器翻译系统的原理得知,机器翻译系统主要是以句子为单位进行语法分析和转换,所以机器翻译系统的缺点是缺乏客观经验知识,和不具备上下文信息的判断及认知学习能力。歧义现象是自然语言的显著特点,但人类可以轻而易举解决的歧义问题,计算机处理起来却很棘手。本文第三部分分类列举了各种歧义现象,歧义主要分为语义歧义、句法结构歧义两大类。语义歧义指语义确定问题,首先是英汉数词转换中的量词歧义,机译系统有时无法判断加什么相应中文量词。机译系统在词性相同的情况下,由于缺乏语义限制,而无法决定词义,这是一词多义歧义.又由于机译系统的语法规则生成性很强,在语法结构相似时,无法决定词的词性,叫兼类歧义。而且机译系统缺乏上下文信息判断能力,无法正确回指代词指代对象,是代词回指歧义。句法歧义主要是句法分析中的结构歧义。其中,除了英语长句断句歧义外,修饰成分歧义也是个很大的难题,包括系统判定定语从句、“of”短语、介词短语、并列结构的修饰对象及范围。本文还讨论了以上所有歧义现象对机译系统翻译效果的影响,主要有原文无歧义,译文无歧义;原文无歧义,译文有歧义;原文有歧义,译文无歧义这三个方面。 针对这些歧义现象,论文在第四部分提出了一些可行的消歧策略。消歧目前主要有语言学消歧法和统计消歧法。传统的机器翻译系统一般采用语言学方法,本文也是从这方面着手讨论消歧问题的。语言学消歧包括语义消歧、句法消歧和语用消歧。语义消歧的主要策略是对机译系统进行语义限定,包括形态消歧和词义消歧。形态消歧是在司法分析模块中制定规则,对输入词的形态结构进行限制,初步判断词性,并把判断结果输给句法分析模块。词义消歧的方法目前有三种。一是基于语料库消歧,即运用隐马尔可夫模型及计算 机学习算法构建无歧义指导型语料库,并对语料库中的语料进行词性标注,或构建未标汪 的对齐语料库。二是采用基于知识的消歧方法,在系统词典、义类词典、词网中进行语义 限定和语义、句法标注,从而确定词义。笔者参与调试的“译路通”采用的就是用基于知 识的消歧法,即在系统词典中标注近邻和词团约束关系、在引擎中定义语义及语法特性. 这种方法能把词的语义特性和语法功能结合起来,以解决一词多义、兼类和句法歧义问题. 三是基于语料和知识的混合方法.句法消歧是针对句法歧义中的定语从句和并列句歧义, 在翻译引擎中制定共性规则和个性规则.而语用消歧则是利用语用信息消除代词所指歧 义.除了诏言学消歧外还有统计消歧,它是基于海量语料库,统计出词与词之间的概率. 在以上方法都不能消除歧义的情况下,可以在保证翻译可读性的前提下,让机译系统保留 歧义进行翻译. 虽然英汉机器翻译系统中的歧义很难解决,但并不是毫无解决的办法.笔者认为,多 种消歧方法应有效地结合起来。为了得到较好的翻译效果,还应建立友好的人机交互界面 及译后编辑体系.机器翻译的研究正在不断取得新的成果,它势将要克服种种困难,成为 世界各国人民必不可少的、可靠的交流工具。
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2002
【分类号】:H085

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 骆忠武;外交歧义:特点及翻译[D];上海外国语大学;2010年
2 陆正海;[D];电子科技大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 任咏梅;;对中学英语词汇教学的思考[J];阿坝师范高等专科学校学报;2006年S1期
2 周明;称呼语的语用特征及其语用翻译[J];安徽大学学报;2000年03期
3 周方珠;论社交指示的翻译[J];安徽大学学报;2002年01期
4 胡学文;外语阅读的认知模式[J];安徽大学学报;2002年02期
5 张顺生,殷书谊;浅谈汉英词典及其编纂[J];安徽大学学报;2002年04期
6 蒋德红;第二语言习得研究综观[J];安徽大学学报;2003年01期
7 詹全旺;;新闻言语行为分析[J];安徽大学学报(哲学社会科学版);2009年01期
8 徐宏亮;称呼语的社交指示功能[J];安徽广播电视大学学报;2002年02期
9 王惠敏;;大学英语交际性听力测试中的语用预设分析[J];安徽广播电视大学学报;2007年03期
10 陈宏;;文化导向型外语教学模式探索[J];安徽电子信息职业技术学院学报;2005年06期
中国重要会议论文全文数据库 前10条
1 栾育青;;邀请语及应答语的跨文化比较[A];语言与文化研究(第二辑)[C];2008年
2 闫丽华;;从儿童母语习得看二语学习中的错误[A];语言与文化研究(第四辑)[C];2009年
3 徐芳;;Cooperative Principle and English Humorous Utterance[A];语言与文化研究(第五辑)[C];2010年
4 黄明;;浅析中国高校英语考试中的问题[A];语言与文化研究(第五辑)[C];2010年
5 邱林林;;委婉语功能的语用学研究[A];语言与文化研究(第六辑)[C];2010年
6 张生祥;;跨文化交际教学中的误区解析[A];语言与文化研究(第八辑)[C];2011年
7 游淑芬;;值得推荐的一本工具书——1995年新版《汉英词典》[A];第二届全国双语词典学术研讨会暨福建省辞书学会第九届年会论文集[C];1996年
8 杨壮春;;词典·读者·语用[A];中国辞书学会双语词典专业委员会第三届年会暨学术研讨会论文集[C];1998年
9 向朝红;;英汉词典语用信息处理现状的调查及分析[A];中国辞书学会双语词典专业委员会第三届年会暨学术研讨会论文集[C];1998年
10 傅维贤;;对比与双语词典[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 马腾;民族院校英语专业学生语际语语用能力及其培养模式研究[D];上海外国语大学;2010年
2 郭继东;中国EFL学习者中介语交际策略研究[D];上海外国语大学;2010年
3 龙翔;中国英语学习者言语交际中语用失误之研究[D];上海外国语大学;2010年
4 杨石乔;基于语料库的汉语医患会话修正研究[D];上海外国语大学;2010年
5 卢玉卿;文学作品中言外之意的翻译研究[D];南开大学;2010年
6 刘娜;哲学语用学视域中的教育实践[D];南开大学;2010年
7 龙又珍;现代汉语寒暄系统研究[D];武汉大学;2009年
8 申宣成;表现性评价在语文综合性学习中的应用[D];华东师范大学;2011年
9 龚娜;湘方言程度范畴研究[D];湖南师范大学;2011年
10 陈静;语用认知视角下的指称研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴丹;语言学术语汉译规范化研究[D];南昌航空大学;2010年
2 王明亮;人称指示映射现象的认知研究[D];山东科技大学;2010年
3 许丹;英语广告语中语用预设的研究[D];山东科技大学;2010年
4 赵才华;会话含义及其在大学英语听力教学中应用的实证研究[D];山东科技大学;2010年
5 宋文平;现代汉语“A而不B”格式的多角度研究[D];哈尔滨师范大学;2010年
6 赵桂阳;现代汉语“不是X的X”结构考察[D];哈尔滨师范大学;2010年
7 刘莹;语用对等理论视角下汉语商标词英译研究[D];广西师范学院;2010年
8 卫青;农村高中英语词汇习得语境化研究[D];广西师范学院;2010年
9 陈建林;基于语料库的国际英语学习者书面语中使用模糊限制语的对比研究[D];上海外国语大学;2010年
10 顾铮;英汉比喻类颜色词语对比分析[D];上海外国语大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 严晓萍;有意歧义及其翻译[J];贵州工业大学学报(社会科学版);2003年04期
2 胡开宝;结构歧义与翻译中的逻辑应用[J];合肥工业大学学报(社会科学版);1992年01期
3 沈开木;论“语义指向”[J];华南师范大学学报(社会科学版);1996年01期
4 王霄凌;论外事翻译的特点[J];济南大学学报(社会科学版);2002年05期
5 黄慧君;歧义与翻译中对待歧义的策略[J];集美大学学报(哲学社会科学版);2002年02期
6 原传道;英语蓄意性歧义的翻译策略[J];中国科技翻译;2004年04期
7 王逢鑫;歧义、误解与误译[J];山东外语教学;1997年03期
8 张顺生;;政治词语翻译应当讲政治——对《反分裂国家法》英译的反思[J];上海翻译;2006年01期
9 辛斌;批评语言学与英语新闻语篇的批评性分析[J];外语教学;2000年04期
10 项成东;歧义的语用研究[J];外语教学;2002年04期
中国博士学位论文全文数据库 前1条
1 邵严毅;蓄意歧义作为言语交际策略的语用研究[D];上海外国语大学;2008年
中国硕士学位论文全文数据库 前4条
1 杨晓峰;汉英机器翻译系统中的一种语义排岐模型研究[D];厦门大学;2001年
2 张国俊;意识形态对翻译的影响[D];郑州大学;2004年
3 曾建萍;译者主体性与汉语中某些歧义词句的翻译[D];湖南师范大学;2006年
4 饶双燕;蓄意歧义的语用研究[D];上海外国语大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 冯志伟;英日机器翻译系统E-to-J原语分析中的兼类词消歧策略[J];中文信息学报;1999年05期
2 余加柱;;现代汉语自动句法分析中“打”的语法功能消歧[J];语文学刊;2007年S1期
3 齐超;;同形异义词歧义问题的认知语用研究[J];河北科技师范学院学报(社会科学版);2008年03期
4 顾琦一;程秀苹;;中国英语学习者的花园路径句理解——与工作记忆容量和语言水平的相关研究[J];现代外语;2010年03期
5 杨春雷;;面向语用解释消歧的量化名词短语约束条件系统[J];语言文字应用;2011年01期
6 邱金萍;裴雨来;;几种动词义项区分的判定方法[J];滁州学院学报;2009年02期
7 安玉青;;汉语简单句中的量词辖域歧义及其消歧研究[J];青岛大学师范学院学报;2010年02期
8 马生仓;中西文化差异与语义歧义[J];固原师专学报;1995年02期
9 肖水来;跨文化交际中的语义歧义现象[J];咸宁师专学报;2001年02期
10 邱述德;;歧义刍议[J];外语与外语教学;1992年03期
中国重要会议论文全文数据库 前10条
1 周晓;李超;胡明涵;王会珍;;基于人物互斥属性的中文人名消歧[A];第六届全国信息检索学术会议论文集[C];2010年
2 李丽;孙甲申;王小捷;李江;宋占江;;基于属性信息的中文人名消歧[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
4 时迎超;王会珍;肖桐;胡明涵;;面向人名消歧任务的人名识别系统[A];第六届全国信息检索学术会议论文集[C];2010年
5 丁海波;肖桐;朱靖波;;基于多阶段的中文人名消歧聚类技术的研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 周云;王挺;易绵竹;王之元;;全词消歧的序列标注方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 冯志伟;;机器翻译系统消歧功能测试[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 杨晓安;;“没有VP的NP”型结构消歧的韵律手段[A];第九届中国语音学学术会议论文集[C];2010年
9 方向红;宋春阳;;介连兼类词“以”的句法语义区别特征及消歧策略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 董亦农;;一个基于CFG的汉语句法分析器模型[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 张素芳 译 陈永伶 校;《消歧公约》面临新挑战[N];中国妇女报;2000年
2 北京科技大学法律系副教授 王竹青;《消歧公约》与中国司法实践[N];中国妇女报;2010年
3 本报记者木佳;私企难入农业科研门[N];中华工商时报;2003年
4 本报记者 王春霞;性别平等有助实现全面建设和谐社会[N];中国妇女报;2007年
5 本报记者 胡京春;跳出农业抓农业[N];人民政协报;2003年
6 傅燕;呼吁两会更多关注性别平等话题[N];中国妇女报;2007年
7 薛宁兰;我国妇女人权与法律的回顾和展望[N];中国社会科学院院报;2005年
8 谢虹;今春,民工返城不见“潮”[N];江苏经济报;2005年
9 夏吟兰;在妇女人权框架下研究家庭暴力[N];法制日报;2004年
10 乃木;只有这样的城镇才能长大[N];中华建筑报;2000年
中国博士学位论文全文数据库 前10条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
2 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
3 于永新;基于本体的图像语义识别和检索研究[D];天津大学;2009年
4 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
5 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
6 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
7 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
8 姜丽丽;实体搜索与实体解析方法研究[D];兰州大学;2012年
9 文娟;统计语言模型的研究与应用[D];北京邮电大学;2010年
10 张京楣;基于统计方法的文本风格分析研究[D];山东大学;2012年
中国硕士学位论文全文数据库 前10条
1 叶君梅;英汉机器翻译中的歧义及消歧策略[D];广西师范大学;2002年
2 裴飞;基于聚类的英汉人名消歧研究[D];苏州大学;2011年
3 沈剑平;面向网络人物搜索的中文人名消歧[D];哈尔滨工业大学;2010年
4 李丽;基于属性信息的中文人名消歧研究[D];北京邮电大学;2012年
5 朱小婷;基于本体的中文人名消歧[D];华东师范大学;2013年
6 赵凯祺;实体消歧及其在图像搜索中的应用[D];上海交通大学;2013年
7 舒平芬;个性化搜索中用户语义意图自动识别技术研究[D];东北大学;2008年
8 陈宣荣;[D];电子科技大学;2003年
9 杜婧君;基于中文维基百科的命名实体消歧方法研究[D];杭州电子科技大学;2013年
10 王英帅;Web人名消歧方法的研究与实现[D];苏州大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026