收藏本站
《内蒙古大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于混合策略的汉蒙机器翻译及相关技术研究

王斯日古楞  
【摘要】: 不同的机器翻译方法有各自的优点和局限性。基于混合策略的翻译方法的研究目的就是充分利用各种机器翻译方法的优势,避免每一种翻译方法的不足,达到翻译结果的最优化,从而提高机器翻译系统整体性能。 本文在吸收和借鉴以往机器翻译研究的理论与方法的基础上,结合蒙古文信息处理的现状,并充分利用了其相关的资源,研究和实现了基于混合策略的汉蒙机器翻译系统。我们利用已有开源工具搭建了一个基于短语的汉蒙统计机器翻译系统,同时建立了汉蒙机器翻译系统自动评测平台需要的语言资源。我们在该研究中,为了提高基于短语的汉蒙统计机器翻译的性能,本文从以下几个方面进行了研究和实验: (1)通过加入汉蒙双语词典和对蒙古语名词的格、复数及领属等形式附加成分的形态分析,解决了译文中出现的大量未登录词问题。 (2)提出了基于蒙古语语序的汉语句子调序方法,解决了基于短语统计机器翻译中出现的大量的语序错误。首先把汉语句子进行句法分析;然后根据调序规则进行调序,让汉语句子的语序尽量接近蒙古语句子的语序;最后把调序后的汉语句子送到统计解码器中进行单调解码。 (3)为了解决汉蒙机器翻译中的量词翻译错误,我们对汉语和蒙古语中的量词翻译进行研究的基础上,提出了使用量词表进行翻译,总结出了一对一、多对一、一对零和一对多等汉语量词到蒙古语量词翻译的对应关系,给出了各种对应中的翻译方法。 机器翻译的评测对机器翻译技术的研究具有重要的推动作用。在CWMT2009机器翻译评测中,我们为汉蒙日常用语评测任务提供了训练语料,开发集和测试集。为了准备这些语料开发了基于规则的蒙古语句子自动切分程序和蒙古文拉丁转写到UTF-8编码的转换程序,在此,还介绍了研制这些程序的方法与过程。最后,我们给出了基于混合策略汉蒙机器翻译系统的实验及结果分析。
【学位授予单位】:内蒙古大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:H212;H085.3

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 银花;王斯日古楞;艳红;;基于短语的蒙汉统计机器翻译系统的设计与实现[J];内蒙古师范大学学报(自然科学汉文版);2011年01期
中国重要会议论文全文数据库 前1条
1 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国博士学位论文全文数据库 前3条
1 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
2 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
3 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
中国硕士学位论文全文数据库 前4条
1 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
2 艳红;基于统计的蒙古文自动词性标注的研究与实现[D];内蒙古师范大学;2010年
3 王志杰;统计机器翻译系统在手持设备上的研究与实现[D];内蒙古大学;2012年
4 宝美荣;融入形态学分析的汉蒙统计机器翻译研究[D];内蒙古师范大学;2012年
【参考文献】
中国期刊全文数据库 前6条
1 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
2 刘群;统计机器翻译综述[J];中文信息学报;2003年04期
3 侯宏旭;刘群;那顺乌日图;;基于实例的汉蒙机器翻译[J];中文信息学报;2007年04期
4 敖其尔;从英文到蒙文的机器翻译[J];内蒙古大学学报(哲学社会科学版);1988年03期
5 淑琴;那顺乌日图;;面向EBMT系统的汉蒙双语语料库的构建[J];内蒙古社会科学(汉文版);2006年01期
6 娜步青;;基于统计的蒙汉机器翻译系统研究[J];内蒙古农业大学学报(社会科学版);2006年02期
中国博士学位论文全文数据库 前2条
1 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
2 雪艳;汉蒙词语对齐及相关技术研究[D];内蒙古大学;2009年
中国硕士学位论文全文数据库 前4条
1 吉日木图;基于模板的英蒙机器翻译系统的研究[D];内蒙古大学;2005年
2 李俊;统计机器翻译中解码算法的研究[D];哈尔滨工业大学;2006年
3 乌达巴拉;基于混合策略的蒙—英机器翻译系统的研究[D];内蒙古大学;2007年
4 图格木勒;蒙古语语言资源库建设相关技术研究[D];内蒙古大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 魏长宏;赵宇;;《金山词霸2006》屏幕取词问题研究[J];鞍山师范学院学报;2007年04期
2 于江德;王希杰;;词位标注汉语分词技术详解[J];安阳师范学院学报;2010年05期
3 赵晓凡;胡顺义;;基于正向最大匹配的汉语分词[J];安阳师范学院学报;2010年05期
4 吴华;徐甜;;机器翻译中源语分析的研究与探讨[J];安阳工学院学报;2006年02期
5 包乌云;;敦煌石窟蒙古文题记的佛教文化特色[J];北方语言论丛;2011年00期
6 王光全;同形词族和汉语词类划分[J];北华大学学报(社会科学版);2000年03期
7 金纯;浅谈计算机自然语言理解[J];浙江中医学院学报;2005年03期
8 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
9 刘来旸,瞿有利,樊孝忠;汉语智能输入系统的设计[J];北京理工大学学报;2001年03期
10 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期
中国重要会议论文全文数据库 前10条
1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 通拉嘎;赵小兵;;论蒙古语词素切分的实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 吴秋锋;黄书剑;戴新宇;陈家骏;;一种基于句法的用于汉英翻译的预调序方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 胡阿旭;吕士良;格根塔娜;于洪志;;蒙古语松紧元音言语空气动力学研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 包桂兰;呼和;;蒙古语标准话非词首辅音舌位变化及其约束度研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 余骁捷;邵阳;吴及;王侠;;基于SVM和MMR融和的自动文摘方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 哈斯其木格;呼和;;蒙古语边音/l/的声学和生理研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
9 胡阿旭;吕士良;格根塔娜;于洪志;;蒙古语松紧元音言语空气动力学[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
10 刘建毅;王菁华;王枞;;领域语义语法的统计生成[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 方清明;现代汉语名名复合形式的认知语义研究[D];暨南大学;2011年
2 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
3 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
4 王俊;现代汉语离合词研究[D];华中师范大学;2011年
5 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
6 富涛;面向信息处理的蒙古语简单谓动句句模研究[D];内蒙古大学;2011年
7 乌吉斯古冷;蒙古语标准音朗读语句语调的起伏度研究[D];内蒙古大学;2011年
8 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
9 包桂兰;基于EPG的蒙古语标准音协同发音研究[D];内蒙古大学;2011年
10 翟会锋;三官寨彝语参考语法[D];中央民族大学;2011年
中国硕士学位论文全文数据库 前10条
1 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
2 宝乐儿;初级阶段蒙古学生汉语发音偏误分析及相应的教学对策[D];上海外国语大学;2010年
3 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
4 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
5 张瑶;英汉机器翻译中的英语动词汉译研究[D];大连理工大学;2010年
6 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
7 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
8 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
9 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年
10 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 刘海涛;;基于依存树库的汉语句法计量研究[J];长江学术;2008年03期
2 戚晓杰;关于句子与句类、句型关系的考察[J];昌潍师专学报;2000年03期
3 张明杰,张跃,姚天顺;一种基于词汇功能描述的树库构建方法[J];东北大学学报;2000年03期
4 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
5 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
6 魏善德;郑家恒;;汉语句法树库检索系统的设计与实现[J];电脑开发与应用;2006年11期
7 刘知远;郑亚斌;孙茂松;;汉语依存句法网络的复杂网络性质[J];复杂系统与复杂性科学;2008年02期
8 麻旻艳;;汉语链语法句法分析器的设计与分析[J];广西大学学报(自然科学版);2007年S1期
9 胡裕树;试论句子类型的研究[J];汉语学习;1995年05期
10 彭泽润,李珂;汉语句子结构层次分析方法的进展和问题[J];井冈山师范学院学报;2001年03期
中国重要会议论文全文数据库 前6条
1 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 华沙宝;巴达玛敖德斯尔;;蒙古语语料库建设现状分析和完善策略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 庞文斌;张国煊;曹恬;;基于规则和统计的汉语浅层句法分析的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 赵怿怡;关润池;;汉语依存树库的构建[A];第三届学生计算语言学研讨会论文集[C];2006年
5 王跃龙;韩希;;短语结构树到依存树的转换[A];第三届学生计算语言学研讨会论文集[C];2006年
6 刘海涛;;影响依存句法分析的因素探讨[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前7条
1 额尔敦朝鲁;面向信息处理的蒙古语动词语义研究[D];内蒙古大学;2005年
2 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
3 彭艳;短语结构语法与依存语法的心理现实性研究[D];上海外国语大学;2007年
4 雪艳;汉蒙词语对齐及相关技术研究[D];内蒙古大学;2009年
5 淑琴;蒙古文同形词知识库的构建[D];内蒙古大学;2010年
6 林八鸽;《蒙古语连接形式知识库》的建设[D];内蒙古大学;2009年
7 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
中国硕士学位论文全文数据库 前10条
1 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
2 梁以敏;基于统计的汉语词性标注方法的研究[D];大连理工大学;2004年
3 淑琴;《蒙古语语法信息词典构形附加成分分库》的设计与实现[D];内蒙古大学;2005年
4 吉日木图;基于模板的英蒙机器翻译系统的研究[D];内蒙古大学;2005年
5 朱国华;文本信息处理中汉语句法分析方法研究[D];大连理工大学;2006年
6 娜步青;基于统计的蒙汉机器翻译系统[D];内蒙古大学;2006年
7 苗洪霞;基于短语的统计机器翻译系统的研究与应用[D];沈阳航空工业学院;2007年
8 周俏丽;面向汉语单句的依存句法分析研究[D];沈阳航空工业学院;2006年
9 张卫;中文词性标注的研究与实现[D];南京师范大学;2007年
10 魏瑾;基于统计的汉英机器翻译技术的研究[D];国防科学技术大学;2006年
【二级引证文献】
中国重要会议论文全文数据库 前1条
1 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国博士学位论文全文数据库 前3条
1 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
2 包敏娜;基于蒙古语影视剧语料库的话语标记研究[D];内蒙古大学;2012年
3 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
中国硕士学位论文全文数据库 前6条
1 吴金星;蒙古语词法标注语料库的构建及相关技术研究[D];内蒙古大学;2011年
2 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
3 阿日古娜;蒙古语名词短语句子成分的统计分析研究[D];内蒙古大学;2012年
4 陈红霞;从比格形式名词的语义角色辨析研究[D];内蒙古大学;2012年
5 王志杰;统计机器翻译系统在手持设备上的研究与实现[D];内蒙古大学;2012年
6 宝美荣;融入形态学分析的汉蒙统计机器翻译研究[D];内蒙古师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 涂云杰;基于规则的汉语短语标注探讨[J];呼伦贝尔学院学报;2002年02期
2 尤庆学;汉语歧义研究综述[J];汉语学习;2001年04期
3 鲁松,白硕,黄雄,张健;基于向量空间模型的有导词义消歧[J];计算机研究与发展;2001年06期
4 金克木;“歧义语法”小引[J];江淮论坛;1985年01期
5 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
6 王长胜,刘群;基于实例的汉英机器翻译系统研究与实现[J];计算机工程与应用;2002年08期
7 屈刚,孔骏,陆汝占;一个基于范例推理的机器翻译系统[J];计算机工程;2000年10期
8 S·苏雅拉图;蒙古语动词计算机生成研究[J];计算机学报;2002年11期
9 常宝宝;基于统计的翻译等价词对抽取研究[J];计算机学报;2003年05期
10 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
中国重要会议论文全文数据库 前3条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 李维刚;刘挺;王震;李生;;双语语料库段落重组对齐方法研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 刘非凡;赵军;徐波;;大规模非限定领域汉英双语语料库建设及句子对齐研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前1条
1 朝格吉乐玛;“时”概念的蒙汉语对比研究[D];华东师范大学;2005年
中国硕士学位论文全文数据库 前2条
1 刘兴宇;基于倒排索引的全文检索技术研究[D];华中科技大学;2004年
2 淑琴;《蒙古语语法信息词典构形附加成分分库》的设计与实现[D];内蒙古大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 王均;中国语文现代化的研究成果——评冯志伟新著《自然语言机器翻译新论》[J];中文信息;1998年Z1期
2 彭述初;;机器翻译学科发展综述[J];华中科技大学学报(社会科学版);2006年02期
3 魏任;;布拉格国际数理语言学和机器翻译座谈会[J];当代语言学;1965年06期
4 王宗炎;;日本机器翻译研究近况[J];当代语言学;1984年01期
5 黄宁夏;英汉机译系统语言比较功能处理水平分析[J];漳州师范学院学报(哲学社会科学版);2004年01期
6 鲁孝贤;;机器翻译语义排歧的方法[J];中国科技翻译;2007年04期
7 潘娣;;机器翻译的利弊以及发展前景[J];安徽文学(下半月);2008年09期
8 靜善;“语言学译叢”杂志1959年第2期机器翻译问题专号[J];外语教学与研究;1959年03期
9 郑保山;美国《化学文摘》翻译及机器翻译[J];上海科技翻译;1993年03期
10 刘荣;;构建大规模的汉英双语平行语料库[J];太原科技;2006年10期
中国重要会议论文全文数据库 前10条
1 奚宁;赵迎功;汤光超;李中华;刘友强;戴新宇;陈家骏;;南京大学第七届机器翻译研讨会评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
2 梁芳丽;陈雷;李淼;何绵涛;刘绘;;第七届全国机器翻译研讨会中科院智能所评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 麦热哈巴.艾力;米日古.肉孜;撒依达;江阿古丽;吐尔根.伊布拉音;;新疆大学CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆;;多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 姚天顺;杨莹;;关于机器翻译的评测问题[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 何彦青;石崇德;于薇;张均胜;王惠临;;中国科学技术信息研究所CWMT'2011技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
7 希夏姆.马利克;;汉阿机译研究(一) 从汉语单句若干结构谈论汉阿机译[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 肖桐;张浩;李强;路琦;朱靖波;任飞亮;王会珍;;CWMT2011东北大学参评系统NiuTrans介绍(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
9 李贤华;郑仲光;孟遥;于浩;;第七届全国机器翻译研讨会(CWMT2011)富士通研究开发中心技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 李博渊;奚宁;黄书剑;张建兵;陈家骏;;一种适用于机器翻译的汉语分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国重要报纸全文数据库 前10条
1 凌子浪;机器翻译的未来不可估量[N];计算机世界;2001年
2 《中国电脑教育报》记者 晨风;机器翻译如何是好?[N];中国电脑教育报;2001年
3 赵迎华;机器翻译如何是好[N];光明日报;2001年
4 ;机器翻译在电子政务系统建设中的应用[N];中国电脑教育报;2004年
5 ;机器翻译 在电子政务系统建设中的应用[N];中国电脑教育报;2004年
6 刘 莎;语义约定全文翻译: 机器翻译的“日心说”?[N];计算机世界;2002年
7 何艳霞;韩国完善专利信息系统机器翻译和英文检索功能[N];中国知识产权报;2007年
8 刘仁;“语义分析”升级专利机器翻译[N];中国知识产权报;2008年
9 李佳师;拓展嵌入式空间 中软可借力微软[N];中国电子报;2007年
10 刘素元、艾文;给机器翻译装上“大脑”[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
2 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
3 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
4 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
5 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
6 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
7 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
8 雒自清;语义块类型、构成及变换的分析与处理[D];中国科学院研究生院(声学研究所);2004年
9 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
10 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
中国硕士学位论文全文数据库 前10条
1 朱晓宁;基于语言学知识的机器翻译自动评价研究[D];哈尔滨工业大学;2011年
2 计丽丽;基于混合策略的机器翻译研究[D];安徽理工大学;2012年
3 王内;文学材料和非文学材料机器翻译适用性比较研究[D];湖南师范大学;2012年
4 惠聪;机器翻译中的高级对齐技术和开发集选择策略研究[D];上海交通大学;2012年
5 陈亮;基于英汉平行语料库的机器翻译知识获取研究[D];北京交通大学;2012年
6 朱俊国;机器翻译自动评价计算粒度研究[D];哈尔滨工业大学;2010年
7 麦丽开·阿布德瓦力;面向机器翻译的汉维词语对齐规范[D];新疆大学;2012年
8 占飞;计算语言学领域英文辅助写作系统[D];哈尔滨工业大学;2011年
9 李平;基于Internet的人机互助机器翻译技术的研究[D];内蒙古大学;2012年
10 赵小曼;英汉平行语料库句子级对齐研究及其在机器翻译中的应用[D];安徽大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026