收藏本站
《哈尔滨理工大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于标志词的汉英机器翻译的研究

郑军  
【摘要】: 基于实例的机器翻译(EBMT)系统在特定领域下可以高效地生成准确的译文,并且翻译知识可以自动获取,系统构建周期短。所以研究基于实例的机器翻译模型对基于语料库的机器翻译方法以及自然语言处理研究具有重要的理论意义和实用价值。 基于实例机器翻译面临的一个基本问题是如何确定翻译实例。翻译实例对基于实例的机器翻译系统的性能有决定性的作用,但目前对此并没有深入的研究。本文使用语言学中的标志词假设来指导汉英翻译单元的抽取,取得了较好的抽取效果。 本文从以下角度对标志词在汉英EBMT中的应用进行了研究:①确定了汉语标志词。在介绍了目前已经使用的英语标志词后,提出了汉语的标志词,并通过对一个较大文本的统计信息证明了这些标志词的分割句子相对独立单元的作用;②提出利用标志词抽取汉英翻译单元的方法。在确定了汉语标志词的基础上,本文提出了三种利用标志词和词语对齐抽取汉英翻译单元的方法,分别是利用标志词分割的句子碎片到串、标志词对词语对齐抽取方法修整方法以及以上两种方法的综合。这些方法不需要深层的句法知识,避免了过多的累积误差;③提出翻译单元的评价方法,较高的提升了汉英EBMT系统的性能。本文提出了翻译单元的质量评价和系统集成评价相结合的评价策略。首先提出了翻译单元的质量评价原则和质量划分,并在此基础上对本文提出的翻译单元抽取方法的抽取结果进行了评价,证明了这些方法的有效性。而后系统集成评价证明了这些翻译单元可提升翻译系统的性能。从而证实了标志词假设应用在翻译单元抽取中可取得较好的效果。
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP391.2

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 杨书卷;;“万能”方法的解决之道[J];科技导报;2011年19期
2 毛太田;傅佳;;通过Web数据挖掘为VILA语言搜集多语种词汇[J];中国科技信息;2011年16期
3 庞观松;张黎莎;蒋盛益;;个性化跨语言学术搜索技术研究[J];情报学报;2011年08期
4 占飞;刘挺;;面向英文辅助写作的词语相似度应用研究[J];智能计算机与应用;2011年03期
5 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
6 胡莉;;中文“词”的语言模型识别研究方法综述[J];北方文学(下半月);2011年03期
7 蒙太奇;;最佳在线翻译也雷人[J];黄金时代(学生族);2009年12期
8 扎西加;高定国;;藏语语料库TEI标记规范探讨[J];中文信息学报;2011年04期
9 朱祝武;;人工智能发展综述[J];中国西部科技;2011年17期
10 王海峰;赵世奇;;面向互联网的计算语言学研究[J];智能计算机与应用;2011年03期
中国重要会议论文全文数据库 前10条
1 姚天顺;杨莹;;关于机器翻译的评测问题[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 奚宁;赵迎功;汤光超;李中华;刘友强;戴新宇;陈家骏;;南京大学第七届机器翻译研讨会评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 何彦青;石崇德;于薇;张均胜;王惠临;;中国科学技术信息研究所CWMT'2011技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 梁芳丽;陈雷;李淼;何绵涛;刘绘;;第七届全国机器翻译研讨会中科院智能所评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 希夏姆.马利克;;汉阿机译研究(一) 从汉语单句若干结构谈论汉阿机译[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 肖桐;张浩;李强;路琦;朱靖波;任飞亮;王会珍;;CWMT2011东北大学参评系统NiuTrans介绍(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
7 麦热哈巴.艾力;米日古.肉孜;撒依达;江阿古丽;吐尔根.伊布拉音;;新疆大学CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
8 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆;;多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
9 李贤华;郑仲光;孟遥;于浩;;第七届全国机器翻译研讨会(CWMT2011)富士通研究开发中心技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 赵红梅;吕雅娟;贲国生;黄云;刘群;;第七届全国机器翻译研讨会(CWMT2011)评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 凌子浪;机器翻译的未来不可估量[N];计算机世界;2001年
2 《中国电脑教育报》记者 晨风;机器翻译如何是好?[N];中国电脑教育报;2001年
3 赵迎华;机器翻译如何是好[N];光明日报;2001年
4 ;机器翻译在电子政务系统建设中的应用[N];中国电脑教育报;2004年
5 ;机器翻译 在电子政务系统建设中的应用[N];中国电脑教育报;2004年
6 刘 莎;语义约定全文翻译: 机器翻译的“日心说”?[N];计算机世界;2002年
7 何艳霞;韩国完善专利信息系统机器翻译和英文检索功能[N];中国知识产权报;2007年
8 刘仁;“语义分析”升级专利机器翻译[N];中国知识产权报;2008年
9 刘素元、艾文;给机器翻译装上“大脑”[N];中国计算机报;2002年
10 李佳师;拓展嵌入式空间 中软可借力微软[N];中国电子报;2007年
中国博士学位论文全文数据库 前10条
1 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
2 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
3 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
4 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
5 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
6 雒自清;语义块类型、构成及变换的分析与处理[D];中国科学院研究生院(声学研究所);2004年
7 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
8 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
9 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
10 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱晓宁;基于语言学知识的机器翻译自动评价研究[D];哈尔滨工业大学;2011年
2 计丽丽;基于混合策略的机器翻译研究[D];安徽理工大学;2012年
3 王内;文学材料和非文学材料机器翻译适用性比较研究[D];湖南师范大学;2012年
4 惠聪;机器翻译中的高级对齐技术和开发集选择策略研究[D];上海交通大学;2012年
5 朱俊国;机器翻译自动评价计算粒度研究[D];哈尔滨工业大学;2010年
6 麦丽开·阿布德瓦力;面向机器翻译的汉维词语对齐规范[D];新疆大学;2012年
7 赵小曼;英汉平行语料库句子级对齐研究及其在机器翻译中的应用[D];安徽大学;2010年
8 陈亮;基于英汉平行语料库的机器翻译知识获取研究[D];北京交通大学;2012年
9 李平;基于Internet的人机互助机器翻译技术的研究[D];内蒙古大学;2012年
10 占飞;计算语言学领域英文辅助写作系统[D];哈尔滨工业大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026