收藏本站
《哈尔滨工业大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

机器翻译自动评价计算粒度研究

朱俊国  
【摘要】:机器翻译自动评价是机器翻译研究中的一个重要环节,在机器翻译系统的开发周期中起着重要的作用。目前一些简单的基于字符串相似度的方法虽然能高速的对译文进行评价,但是其评价结果存在着严重的偏向性。国际研究中的主流改进方法是融入更多的语言学信息。这样虽然能让评价模型的性能得到提高,但是却因其用到了语言学信息,而丧失了语言的独立性。事实上,语言学信息的引入可以被认为是一种单元匹配时计算单位(粒度)的改变。 为了将提高自动评价方法的精度、速度,扩大应用的范围,我们从改变机器翻译自动评价模型计算粒度的角度出发,提出了一系列机器翻译自动评价方法: 首先,我们提出了基于字母的机器翻译自动评价的方法。这一评价方法既具有语言独立性,并且又能解决部分的词语曲折变化等问题。同时为了进一步改进基于字母的机器翻译自动评价方法的性能,我们提出了i_Letter_BLEU和i_Letter_Recall两种方法,这两种方法能够根据标准译文自动地调整参数,使得基于字母的机器翻译自动评价方法的性能更加稳定。 其次,我们根据现有的基于机器学习的特征融合方法,提出了基于表层信息的多粒度特征融合方法。该方法在SVM排序和回归模型框架下进行特征融合。经过特征选择仅使用了少量的特征就在往年评测数据上取得了与评测时最高成绩可比较的结果。并且值得注意的是,这种方法没有用到任何的深层的语言学信息,是语言独立的。 最后,我们将语言学特征用字符串表示,在一系列的基于语言学的计算粒度上分析语言学特征的对于机器翻译自动评价的贡献,提出了基于语言学多粒度特征融合的自动评价模型。该方法仍然在SVM排序和回归模型框架下进行特征的融合。该方法经过特征选择,从大量不同粒度的特征中进行选择,提出了一种较低的计算复杂度的方法,但是相对于其他传统方法具有更高的性能。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.2

手机知网App
【共引文献】
中国期刊全文数据库 前10条
1 尚福华,王宏威,黄真;自动评价机器翻译译文质量的一种方法[J];大庆石油学院学报;2004年03期
2 尹宝生;苗雪雷;季铎;蔡东风;张桂平;;大规模无参考译文质量自动评测技术的研究[J];沈阳航空航天大学学报;2012年01期
3 姚建民,周明,赵铁军,李生;基于句子相似度的机器翻译评价方法及其有效性分析[J];计算机研究与发展;2004年07期
4 张卫晴;张政;;从机器翻译评测看机器翻译发展[J];中国科技翻译;2008年02期
5 程葳,徐波;一种面向口语的译文质量自动评价方法[J];中文信息学报;2002年02期
6 张剑,吴际,周明;机器翻译评测的新进展[J];中文信息学报;2003年06期
7 常宝宝;俞士汶;;语料库技术及其应用[J];外语研究;2009年05期
8 费鲲;;机器翻译中句法分析的设计与实现[J];计算机工程与设计;2006年15期
9 柏晓静;俞士汶;朱学锋;;自然语言处理中的技术评测及关于英语专业考试的思考[J];外语电化教学;2010年01期
10 宗成庆;曹右琦;俞士汶;;中文信息处理60年[J];语言文字应用;2009年04期
中国重要会议论文全文数据库 前2条
1 姚建民;赵铁军;李生;;机器翻译评价方法的实现及翻译系统聚类[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 朱俊国;杨沐昀;;基于译文加权的BLEU改进方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前2条
1 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
2 王博;机器翻译系统的自动评价及诊断方法研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前6条
1 任志敏;对齐技术的研究及其在译文自动评测中的应用[D];沈阳航空航天大学;2011年
2 张丽云;英汉机器翻译系统自动评测方法的研究与实现[D];北京工业大学;2006年
3 潘璐;英汉机器翻译译文质量评价方法研究[D];苏州大学;2007年
4 李巨凤;基于排序学习的翻译自动评价方法的研究[D];哈尔滨工业大学;2009年
5 吴溢;汉英机器翻译对比研究[D];浙江大学;2009年
6 马超;基于统计机器翻译日志的系统融合方法研究[D];上海交通大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 王挺;陈火旺;史晓东;;语料库和机器翻译[J];计算机科学;1996年02期
2 冯志伟;;机器翻译今昔谈[J];金秋科苑;1997年04期
3 李剑 ,王波 ,郭永辉 ,王炳锡;英汉机器翻译中基于模式的译文生成[J];微计算机信息;2005年20期
4 ;计算机检索、机器翻译编辑、自动标引、自动文摘等[J];电子科技文摘;2006年02期
5 张健青;贾欣岚;;英汉机器翻译中一些问题的探讨[J];术语标准化与信息技术;2008年04期
6 史晓亮;;英汉机器翻译中语言陷阱的自动检索标识方法[J];科技信息;2011年03期
7 龚文涛,徐国桓,武立莹,刘会霞,张世红;信息检索技术的发展概况及趋势[J];医学情报工作;2001年03期
8 黄德根;刘小华;李丽双;;汉英机器翻译中趋向动词处理研究[J];大连理工大学学报;2006年05期
9 ;新品速递[J];中国传媒科技;2006年10期
10 刘海涛;;机器翻译中的语篇连贯问题[J];情报科学;1992年03期
中国重要会议论文全文数据库 前10条
1 姚天顺;杨莹;;关于机器翻译的评测问题[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 奚宁;赵迎功;汤光超;李中华;刘友强;戴新宇;陈家骏;;南京大学第七届机器翻译研讨会评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 何彦青;石崇德;于薇;张均胜;王惠临;;中国科学技术信息研究所CWMT'2011技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 梁芳丽;陈雷;李淼;何绵涛;刘绘;;第七届全国机器翻译研讨会中科院智能所评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 希夏姆.马利克;;汉阿机译研究(一) 从汉语单句若干结构谈论汉阿机译[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 肖桐;张浩;李强;路琦;朱靖波;任飞亮;王会珍;;CWMT2011东北大学参评系统NiuTrans介绍(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
7 麦热哈巴.艾力;米日古.肉孜;撒依达;江阿古丽;吐尔根.伊布拉音;;新疆大学CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
8 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆;;多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
9 李贤华;郑仲光;孟遥;于浩;;第七届全国机器翻译研讨会(CWMT2011)富士通研究开发中心技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 赵红梅;吕雅娟;贲国生;黄云;刘群;;第七届全国机器翻译研讨会(CWMT2011)评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 凌子浪;机器翻译的未来不可估量[N];计算机世界;2001年
2 《中国电脑教育报》记者 晨风;机器翻译如何是好?[N];中国电脑教育报;2001年
3 赵迎华;机器翻译如何是好[N];光明日报;2001年
4 ;机器翻译在电子政务系统建设中的应用[N];中国电脑教育报;2004年
5 ;机器翻译 在电子政务系统建设中的应用[N];中国电脑教育报;2004年
6 刘 莎;语义约定全文翻译: 机器翻译的“日心说”?[N];计算机世界;2002年
7 何艳霞;韩国完善专利信息系统机器翻译和英文检索功能[N];中国知识产权报;2007年
8 刘仁;“语义分析”升级专利机器翻译[N];中国知识产权报;2008年
9 李佳师;拓展嵌入式空间 中软可借力微软[N];中国电子报;2007年
10 刘素元、艾文;给机器翻译装上“大脑”[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
2 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
3 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
4 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
5 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
6 雒自清;语义块类型、构成及变换的分析与处理[D];中国科学院研究生院(声学研究所);2004年
7 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
8 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
9 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
10 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱俊国;机器翻译自动评价计算粒度研究[D];哈尔滨工业大学;2010年
2 朱晓宁;基于语言学知识的机器翻译自动评价研究[D];哈尔滨工业大学;2011年
3 计丽丽;基于混合策略的机器翻译研究[D];安徽理工大学;2012年
4 王内;文学材料和非文学材料机器翻译适用性比较研究[D];湖南师范大学;2012年
5 惠聪;机器翻译中的高级对齐技术和开发集选择策略研究[D];上海交通大学;2012年
6 麦丽开·阿布德瓦力;面向机器翻译的汉维词语对齐规范[D];新疆大学;2012年
7 李平;基于Internet的人机互助机器翻译技术的研究[D];内蒙古大学;2012年
8 赵小曼;英汉平行语料库句子级对齐研究及其在机器翻译中的应用[D];安徽大学;2010年
9 陈亮;基于英汉平行语料库的机器翻译知识获取研究[D];北京交通大学;2012年
10 李彧;构建集成系统:基于规则与统计数据的机器翻译[D];广东商学院;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026