收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于词缀特征的汉蒙统计机器翻译系统

宋美娜  
【摘要】: 在当今世界,随着信息的急剧增加,国际交流的日趋频繁,机器翻译的潜在需求越来越大。机器翻译方法按照其使用理论不同可以分为基于规则的、基于语料库的和混合翻译方法三种。不同的机器翻译方法有各自的优点和局限性。基于规则的方法可以很准确的描述语言特征规律,但是它很难覆盖所有的语言现象;基于实例的方法译文质量非常高,但是命中率非常低,对语料库的要求也非常严格;统计翻译方法可以缓解知识获取的瓶颈问题,但是它所采用的N元语法模型无法解决长距离依存问题,并且还存在着语料库标注体系不完善、语料库数据稀疏等问题。 因此不管采用哪种翻译方法,总是不能取得理想的效果。所以基于混合策略的机器翻译方法成为当今机器翻译研究的焦点,从而可以避免每种翻译方法的不足,达到翻译结果的最优化。 由于蒙古语属于黏着语,它的构词和构形都是以词根、词干上连接不同的词缀来完成的,从句子的基本语序看,属于SOV(主宾谓)型语言。单从译文方面来分析,词形变化方面的错误以及句子语序混乱问题比较明显和突出。 因此,本文专门针对蒙古语的特点,利用开源的基于短语的统计机器翻译的Moses解码器,在此基础上加入trigger对长距离蒙古语语言模型以及汉蒙调序模型两个特征,最后实验结果表明,翻译结果是合理的,相对于Moses对比系统来说,翻译性能有了明显提高。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李卫疆;赵铁军;王宪刚;;基于统计机器翻译模型的查询扩展[J];电子与信息学报;2008年03期
2 杨攀;李淼;张建;;基于短语统计翻译的汉维机器翻译系统[J];计算机应用;2009年07期
3 孙守安;杨根科;杨祖华;;基于受限语料库的语言平滑算法比较研究[J];微型电脑应用;2010年12期
4 张亚军;;汉语-维吾尔语机器翻译解码器研究[J];昌吉学院学报;2011年03期
5 银花;王斯日古楞;艳红;;基于短语的蒙汉统计机器翻译系统的设计与实现[J];内蒙古师范大学学报(自然科学汉文版);2011年01期
6 刘加;汉语大词汇量连续语音识别系统研究进展[J];电子学报;2000年01期
7 丁华福,李毅,尚福华;机器翻译质量自动评价的实践[J];黑龙江工程学院学报;2002年03期
8 曲卫民,张俊林,孙乐,孙玉芳;基于记忆的自适应汉语语言模型的研究[J];中文信息学报;2003年05期
9 骆卫华;刘群;白硕;;面向大规模语料的语言模型研究新进展[J];计算机研究与发展;2009年10期
10 黎志升;王煦法;;基于Language Model的地理信息检索模型(英文)[J];中国科学技术大学学报;2010年02期
11 张建平;语音识别与理解的语言统计模型和搜索算法[J];电子商务;1999年09期
12 黄顺珍,方棣棠;利用语言模型实现音字转换的高效解码算法[J];深圳大学学报(理工版);2000年04期
13 申广忠;;蒙古语语音识别系统语言模型的设计[J];微计算机信息;2007年12期
14 侯宏旭;刘群;刘志文;张国强;;Skip-N蒙古文统计语言模型[J];内蒙古大学学报(自然科学版);2008年02期
15 刘加,潘胜昔,江金涛,胡凯军,王作英;用 TMS320C31 实时实现电话语音识别系统[J];清华大学学报(自然科学版);1998年09期
16 刘建成;蒋新华;吴今培;;应用改进型微粒群算法优化语言模型[J];小型微型计算机系统;2006年12期
17 韩中元;李生;齐浩亮;杨沐昀;;面向信息检索的近邻语言模型[J];中文信息学报;2011年01期
18 吴友政;赵军;徐波;;基于主题语言模型的句子检索算法[J];计算机研究与发展;2007年02期
19 金翔;;改进型微粒群算法语言模型的研究[J];软件导刊;2007年13期
20 吴军,王作英;汉语信息熵和语言模型的复杂度[J];电子学报;1996年10期
中国重要会议论文全文数据库 前10条
1 奚宁;赵迎功;汤光超;李斌;罗春勇;戴新宇;陈家骏;;统计机器翻译中多种语言模型的融合[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
2 付晓寅;魏玮;徐波;;一种基于状态转移的N元语言模型快速查询方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 董兴华;周俊林;郭树盛;吐尔洪·吾司曼;;基于短语的汉维(维汉)统计机器翻译研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 朱海;李淼;张建;乌达巴拉;;系统融合方法在汉蒙统计机器翻译上的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 姚树杰;肖桐;朱靖波;;基于句对质量和覆盖度的统计机器翻译训练语料选取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 巢文涵;李舟军;;ZZX_MT系统CWMT2011评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
8 李响;徐金安;刘群;吕雅娟;姜文斌;;移动终端机器翻译设备的解码定点化方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 陈振标;徐波;;限定领域的语言模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 杜金华;王莎;;西安理工大学统计机器翻译系统技术报告(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 蒋宏飞;基于同步树替换文法的统计机器翻译方法研究[D];哈尔滨工业大学;2010年
2 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
3 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
4 段楠;统计机器翻译的一致性解码方法研究[D];天津大学;2012年
5 黄书剑;统计机器翻译中的词对齐研究[D];南京大学;2012年
6 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
7 陈毅东;基于短语的统计机器翻译模型若干关键技术研究[D];厦门大学;2008年
8 肖镜辉;非时齐语言建模技术研究及实践[D];哈尔滨工业大学;2007年
9 刘鹏远;基于知识自动获取的无指导译文消歧方法研究[D];哈尔滨工业大学;2008年
10 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 汤小娜;词义消歧在统计机器翻译中的应用研究[D];厦门大学;2007年
2 宋美娜;基于词缀特征的汉蒙统计机器翻译系统[D];内蒙古大学;2010年
3 张润延;海量语言模型的研究及其在机器翻译中的应用[D];厦门大学;2009年
4 李新生;基于改进语言模型的相关反馈方法的检索系统设计[D];北京邮电大学;2011年
5 张涛;面向特定领域的统计机器翻译研究与应用[D];昆明理工大学;2011年
6 李函章;统计机器翻译中语料选择方法研究[D];黑龙江大学;2010年
7 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
8 李天宁;词对齐技术研究及统计机器翻译平台的构建[D];东北大学;2009年
9 张育;基于依存语法的统计机器翻译研究[D];苏州大学;2011年
10 王志杰;统计机器翻译系统在手持设备上的研究与实现[D];内蒙古大学;2012年
中国重要报纸全文数据库 前10条
1 清华大学 刘加;识别语音的几种依据[N];计算机世界;2006年
2 清华大学 刘加;语音识别应用促进技术发展[N];计算机世界;2006年
3 何中军米海涛 刘群;统计机器翻译系统中的开源软件[N];计算机世界;2007年
4 本报记者 刘洪宇;当机器听懂了我们的声音[N];辽宁日报;2008年
5 郝亭;软件是怎样“炼”成的[N];工人日报;2000年
6 中科院计算技术研究所 吕雅娟付雷 黄瑾 何中军 刘群;化繁为简的统计机器翻译技术[N];中国计算机报;2007年
7 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
8 北京清华大学电子工程系副教授 刘加 教授 刘润生;让机器听懂我的话[N];科技日报;2001年
9 石天强;“凡客体”中的资本欲望[N];中国教育报;2010年
10 骆卫华 刘群 张俊林;搜索引擎:性能提高遇到瓶颈[N];计算机世界;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978