收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于混合策略的汉蒙机器翻译及相关技术研究

王斯日古楞  
【摘要】: 不同的机器翻译方法有各自的优点和局限性。基于混合策略的翻译方法的研究目的就是充分利用各种机器翻译方法的优势,避免每一种翻译方法的不足,达到翻译结果的最优化,从而提高机器翻译系统整体性能。 本文在吸收和借鉴以往机器翻译研究的理论与方法的基础上,结合蒙古文信息处理的现状,并充分利用了其相关的资源,研究和实现了基于混合策略的汉蒙机器翻译系统。我们利用已有开源工具搭建了一个基于短语的汉蒙统计机器翻译系统,同时建立了汉蒙机器翻译系统自动评测平台需要的语言资源。我们在该研究中,为了提高基于短语的汉蒙统计机器翻译的性能,本文从以下几个方面进行了研究和实验: (1)通过加入汉蒙双语词典和对蒙古语名词的格、复数及领属等形式附加成分的形态分析,解决了译文中出现的大量未登录词问题。 (2)提出了基于蒙古语语序的汉语句子调序方法,解决了基于短语统计机器翻译中出现的大量的语序错误。首先把汉语句子进行句法分析;然后根据调序规则进行调序,让汉语句子的语序尽量接近蒙古语句子的语序;最后把调序后的汉语句子送到统计解码器中进行单调解码。 (3)为了解决汉蒙机器翻译中的量词翻译错误,我们对汉语和蒙古语中的量词翻译进行研究的基础上,提出了使用量词表进行翻译,总结出了一对一、多对一、一对零和一对多等汉语量词到蒙古语量词翻译的对应关系,给出了各种对应中的翻译方法。 机器翻译的评测对机器翻译技术的研究具有重要的推动作用。在CWMT2009机器翻译评测中,我们为汉蒙日常用语评测任务提供了训练语料,开发集和测试集。为了准备这些语料开发了基于规则的蒙古语句子自动切分程序和蒙古文拉丁转写到UTF-8编码的转换程序,在此,还介绍了研制这些程序的方法与过程。最后,我们给出了基于混合策略汉蒙机器翻译系统的实验及结果分析。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王均;中国语文现代化的研究成果——评冯志伟新著《自然语言机器翻译新论》[J];中文信息;1998年Z1期
2 彭述初;;机器翻译学科发展综述[J];华中科技大学学报(社会科学版);2006年02期
3 魏任;;布拉格国际数理语言学和机器翻译座谈会[J];当代语言学;1965年06期
4 王宗炎;;日本机器翻译研究近况[J];当代语言学;1984年01期
5 黄宁夏;英汉机译系统语言比较功能处理水平分析[J];漳州师范学院学报(哲学社会科学版);2004年01期
6 鲁孝贤;;机器翻译语义排歧的方法[J];中国科技翻译;2007年04期
7 潘娣;;机器翻译的利弊以及发展前景[J];安徽文学(下半月);2008年09期
8 靜善;“语言学译叢”杂志1959年第2期机器翻译问题专号[J];外语教学与研究;1959年03期
9 郑保山;美国《化学文摘》翻译及机器翻译[J];上海科技翻译;1993年03期
10 刘荣;;构建大规模的汉英双语平行语料库[J];太原科技;2006年10期
11 冯梅;;英汉机器翻译中的常见错误及分析[J];高校社科信息;2001年06期
12 宾科;;文化语境与机器翻译的局限性[J];文教资料;2010年17期
13 王玉昌;;逻辑、语法及机器翻译[J];学术交流;1986年06期
14 侯晓华;刘定远;;浅析机器翻译的发展趋势[J];山西广播电视大学学报;2007年03期
15 徐斌;郑桂芝;;浅谈Google机器翻译在商务英语翻译中的应用[J];山东水利职业学院院刊;2011年01期
16 王振;;翻译对应单位的应用对机器翻译效果的影响[J];英语广场(学术研究);2011年Z5期
17 张健青;贾欣岚;;英汉机器翻译中一些问题的探讨[J];术语标准化与信息技术;2008年04期
18 岳春芳,王丽君,张天伟;机器翻译中的问题与对策[J];河北师范大学学报(哲学社会科学版);2005年04期
19 曹剑;李丹;;目的论指导下的农业领域机器翻译原则[J];黑龙江生态工程职业学院学报;2010年05期
20 于中华,唐常杰,张天庆,朱敏,廖果,李志蜀,沙芦华;“信译”英汉机器翻译系统的语法分析策略[J];小型微型计算机系统;2000年03期
中国重要会议论文全文数据库 前10条
1 奚宁;赵迎功;汤光超;李中华;刘友强;戴新宇;陈家骏;;南京大学第七届机器翻译研讨会评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
2 梁芳丽;陈雷;李淼;何绵涛;刘绘;;第七届全国机器翻译研讨会中科院智能所评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 麦热哈巴.艾力;米日古.肉孜;撒依达;江阿古丽;吐尔根.伊布拉音;;新疆大学CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆;;多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 姚天顺;杨莹;;关于机器翻译的评测问题[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 何彦青;石崇德;于薇;张均胜;王惠临;;中国科学技术信息研究所CWMT'2011技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
7 希夏姆.马利克;;汉阿机译研究(一) 从汉语单句若干结构谈论汉阿机译[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 肖桐;张浩;李强;路琦;朱靖波;任飞亮;王会珍;;CWMT2011东北大学参评系统NiuTrans介绍(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
9 李贤华;郑仲光;孟遥;于浩;;第七届全国机器翻译研讨会(CWMT2011)富士通研究开发中心技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 李博渊;奚宁;黄书剑;张建兵;陈家骏;;一种适用于机器翻译的汉语分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前10条
1 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
2 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
3 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
4 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
5 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
6 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
7 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
8 雒自清;语义块类型、构成及变换的分析与处理[D];中国科学院研究生院(声学研究所);2004年
9 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
10 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
中国硕士学位论文全文数据库 前10条
1 朱晓宁;基于语言学知识的机器翻译自动评价研究[D];哈尔滨工业大学;2011年
2 计丽丽;基于混合策略的机器翻译研究[D];安徽理工大学;2012年
3 王内;文学材料和非文学材料机器翻译适用性比较研究[D];湖南师范大学;2012年
4 惠聪;机器翻译中的高级对齐技术和开发集选择策略研究[D];上海交通大学;2012年
5 陈亮;基于英汉平行语料库的机器翻译知识获取研究[D];北京交通大学;2012年
6 朱俊国;机器翻译自动评价计算粒度研究[D];哈尔滨工业大学;2010年
7 麦丽开·阿布德瓦力;面向机器翻译的汉维词语对齐规范[D];新疆大学;2012年
8 占飞;计算语言学领域英文辅助写作系统[D];哈尔滨工业大学;2011年
9 李平;基于Internet的人机互助机器翻译技术的研究[D];内蒙古大学;2012年
10 赵小曼;英汉平行语料库句子级对齐研究及其在机器翻译中的应用[D];安徽大学;2010年
中国重要报纸全文数据库 前10条
1 凌子浪;机器翻译的未来不可估量[N];计算机世界;2001年
2 《中国电脑教育报》记者 晨风;机器翻译如何是好?[N];中国电脑教育报;2001年
3 赵迎华;机器翻译如何是好[N];光明日报;2001年
4 ;机器翻译在电子政务系统建设中的应用[N];中国电脑教育报;2004年
5 ;机器翻译 在电子政务系统建设中的应用[N];中国电脑教育报;2004年
6 刘 莎;语义约定全文翻译: 机器翻译的“日心说”?[N];计算机世界;2002年
7 何艳霞;韩国完善专利信息系统机器翻译和英文检索功能[N];中国知识产权报;2007年
8 刘仁;“语义分析”升级专利机器翻译[N];中国知识产权报;2008年
9 李佳师;拓展嵌入式空间 中软可借力微软[N];中国电子报;2007年
10 刘素元、艾文;给机器翻译装上“大脑”[N];中国计算机报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978