收藏本站
《内蒙古大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Internet的人机互助机器翻译技术的研究

李平  
【摘要】:随着国际交流日益增多,在计算机、互联网等相关技术日新月异的基础上,机器翻译的技术与应用也取得了蓬勃发展。机器翻译是用计算机来实现不同语言之间的翻译,分为基于规则的机器翻译方法和基于语料库的机器翻译方法。另有,基于混合式的机器翻译方法非常胜行,即:两种方法的结合。如,在基于规则的技术中引入了语料库方法,其中有基于实例的方法、统计方法,通过对语料库的预处理使其转化为自然语言知识库的方法。近年来,基于语料库的机器翻译技术发展较快,得到了广泛的应用,根据不同领域和市场的需求,出现了各色各样有一定实用价值的机器翻译产品,使机器翻译技术真正走向了科技发展的征途。 本文提出的基于Internet的人机互助机器翻译方法是一种新的辅助翻译的方法,该方法异于以往的机器翻译方法,它不完全依赖于机器的自动学习,而是通过网络爬虫技术从Internet上获取双语平行语料,然后在人工的干预下完成整个翻译过程,相比于独立的机器自动翻译,翻译质量更佳,相比于独立的人工翻译,翻译效率更高。 对翻译技术的探究过程中,主要做了以下工作: (1)基于语料库的机器翻译方法可分为两种:基于统计的机器翻译方法和基于实例的机器翻译方法,它们都采用语料库作为翻译知识的来源。本文采用基于统计的机器翻译方法。双语平行语料库是通过网络爬虫技术从Internet获取。 (2)获取语料库后,考虑到语言的复杂性,目前全自动的机器翻译方法还未能完全达到令人满意的效果,因此,该论文提出了对译文进行了人工干预的计算机辅助翻译方法,其采用基于人工打分的译文权重方法使翻译结果达到最优。 (3)在统计机器翻译的过程中,对参数训练中得到的短语表进行有效过滤,使得短语表更加合理。 (4)目前主要采用的是N元语法模型,本文使用的是tri-gram语法模型,该模型构建简单、直接,但同时也因为数据缺乏采取了平滑技术对其进行平滑。 (5)最后,本文加入人工评分与C-value方法,对翻译模型进行改进。实验表明,改进后的机器翻译方法优于传统的机器翻译方法,短语翻译概率表缩减了至少10%,BLEU值也有了一定的提高。
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.2

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 丁信善;语料库语言学的发展及研究现状[J];当代语言学;1998年01期
2 赵炜宏;乔姆斯基语言学的最新发展及其在人工智能中的应用[J];国外社会科学;1997年04期
3 刘秉权,王晓龙;一种面向用户的语言模型及其机器学习方法[J];哈尔滨工业大学学报;2004年02期
4 黄河燕,陈肇雄;基于多策略的交互式智能辅助翻译平台总体设计[J];计算机研究与发展;2004年07期
5 邢永康;马少平;;统计语言模型综述[J];计算机科学;2003年09期
6 邓丹,刘群,俞鸿魁;基于双语词典的汉英词语对齐算法研究[J];计算机工程;2005年16期
7 罗毅;李淼;张建;;一种基于短语统计机器翻译的高效柱搜索解码器[J];计算机应用;2007年08期
8 刘群;统计机器翻译综述[J];中文信息学报;2003年04期
9 张剑,吴际,周明;机器翻译评测的新进展[J];中文信息学报;2003年06期
10 周玉,宗成庆,徐波;基于多层过滤的统计机器翻译[J];中文信息学报;2005年03期
【共引文献】
中国期刊全文数据库 前10条
1 王茜;;基于BLEU的英语翻译自动评分研究[J];安徽电子信息职业技术学院学报;2010年04期
2 李龙澍;;PROLOG线性归结的研究与设计[J];安徽大学学报(自然科学版);1997年03期
3 吴斌;刘剑晖;宋海强;;12121信息流量的变化规律及提高途径[J];现代农业科技;2011年09期
4 程玉胜,任广永;基于ROUGH集的决策树测试属性选择方法[J];安庆师范学院学报(自然科学版);2004年04期
5 程玉胜;Rosetta实验系统在机器学习中的应用[J];安庆师范学院学报(自然科学版);2005年02期
6 吴华;徐甜;;机器翻译中源语分析的研究与探讨[J];安阳工学院学报;2006年02期
7 冯志伟;;信息时代的翻译工具[J];北华大学学报(社会科学版);2007年06期
8 金纯;浅谈计算机自然语言理解[J];浙江中医学院学报;2005年03期
9 张雯;;浅析语料库建设对于语言教学的意义——以对外汉语教学为例[J];北方文学(下半月);2011年11期
10 周海燕;周景辉;;语料库语言学及其在二语习得中的作用[J];长春理工大学学报(社会科学版);2009年06期
中国重要会议论文全文数据库 前10条
1 万菁;姬东鸿;任函;冯文贺;;汉语复合名词短语特征结构的标注研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 吴秋锋;黄书剑;戴新宇;陈家骏;;一种基于句法的用于汉英翻译的预调序方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 黄云;姜文斌;王志洋;祝捷;吕雅娟;刘群;;基于小规模俄汉双语词典的俄语形态切分[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 安娜;刘海涛;侯敏;;语料库中熟语的标记问题[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
6 唐永明;王小捷;文娟;;基于关联词的复句语言模型[A];第三届中国智能计算大会论文集[C];2009年
7 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
8 高秀恒;钱红兵;;一种基于Agent增强的软件审查过程模型[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 任玉辉;张涛;柏庆岩;钱学明;张东平;王云川;;轧钢加热炉加热过程最优控制与智能系统的开发与应用[A];2005中国钢铁年会论文集(第4卷)[C];2005年
10 陶钧;朱学其;林文喜;;高炉配料自动控制方法研究[A];2008年全国炼铁生产技术会议暨炼铁年会文集(下册)[C];2008年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 郑军红;基于知识工程的智能夹具设计系统构建研究[D];浙江大学;2010年
3 许有军;基于扩展规则的若干SAT问题研究[D];吉林大学;2011年
4 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
5 马丽娜;模糊推理方法及知识推理的计量化研究[D];陕西师范大学;2011年
6 胡明娣;逻辑度量空间的内蕴结构的研究[D];陕西师范大学;2011年
7 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
8 缪鹍;公(铁)工程三维选线的群智能算法研究[D];中南大学;2011年
9 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
10 田小勇;文学翻译模糊取向之数字视角[D];上海外国语大学;2011年
中国硕士学位论文全文数据库 前10条
1 朱谦成;基于CLIPS的注塑模具方案智能设计研究及程序实现[D];湘潭大学;2010年
2 徐旭;基于决策树的Web应用系统个性化身份验证研究[D];合肥工业大学;2010年
3 王莹;从互联网上挖掘双语语料的研究与实现[D];华东师范大学;2011年
4 贺靓;基于语料库的机器翻译可行性分析[D];湖南工业大学;2010年
5 林良健;电网调度智能防误系统研究[D];华南理工大学;2010年
6 万亚楠;基于SAP系统的两票防误系统的研发与应用[D];华南理工大学;2010年
7 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
8 曾睿;基于案例推理的突发大气污染事件应急支持系统的研究[D];昆明理工大学;2010年
9 赵小曼;英汉平行语料库句子级对齐研究及其在机器翻译中的应用[D];安徽大学;2010年
10 毛婷瑜;面向个人理财的智能混合系统的研究[D];东华大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,陈文亮;基于领域知识的文本分类[J];东北大学学报;2005年08期
2 王轩,李巍,王晓龙,赵淑香;大标记集汉语字(词)Markov 语言模型的建立[J];哈尔滨工业大学学报;1997年05期
3 陈肇雄,高庆狮;智能化英汉机译系统IMT/EC[J];中国科学(A辑 数学 物理学 天文学 技术科学);1989年02期
4 葛敬民;国内翻译软件的现状和发展方向[J];中国科技翻译;2000年01期
5 张健青,贾欣岚;谈机器翻译[J];中国科技翻译;2000年03期
6 黄河燕,陈肇雄,宋继平;一种人机互动的多策略机器翻译系统IHSMTS的设计与实现原理[J];中文信息学报;1999年05期
7 孙乐,金友兵,杜林,孙玉芳;平行语料库中双语术语词典的自动抽取[J];中文信息学报;2000年06期
8 华沙宝;蒙古文网络信息技术处理的对策[J];民族语文;2002年06期
9 华沙宝;对蒙古文语料库的词类标注系统——AYIMAG[J];内蒙古大学学报(人文社会科学版);1999年05期
10 那顺乌日图;关于面向信息处理的蒙古语语义研究[J];内蒙古大学学报(人文社会科学版);2002年05期
中国重要会议论文全文数据库 前1条
1 刘群;张彤;;汉英机器翻译扩充词典的建造[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
【相似文献】
中国期刊全文数据库 前10条
1 袁琦;中文信息技术和自然语言处理[J];中文信息学报;1986年01期
2 王挺;陈火旺;史晓东;;语料库和机器翻译[J];计算机科学;1996年02期
3 冯志伟;;机器翻译今昔谈[J];金秋科苑;1997年04期
4 李剑 ,王波 ,郭永辉 ,王炳锡;英汉机器翻译中基于模式的译文生成[J];微计算机信息;2005年20期
5 ;计算机检索、机器翻译编辑、自动标引、自动文摘等[J];电子科技文摘;2006年02期
6 张健青;贾欣岚;;英汉机器翻译中一些问题的探讨[J];术语标准化与信息技术;2008年04期
7 史晓亮;;英汉机器翻译中语言陷阱的自动检索标识方法[J];科技信息;2011年03期
8 龚文涛,徐国桓,武立莹,刘会霞,张世红;信息检索技术的发展概况及趋势[J];医学情报工作;2001年03期
9 黄德根;刘小华;李丽双;;汉英机器翻译中趋向动词处理研究[J];大连理工大学学报;2006年05期
10 ;新品速递[J];中国传媒科技;2006年10期
中国重要会议论文全文数据库 前10条
1 奚宁;赵迎功;汤光超;李中华;刘友强;戴新宇;陈家骏;;南京大学第七届机器翻译研讨会评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
2 梁芳丽;陈雷;李淼;何绵涛;刘绘;;第七届全国机器翻译研讨会中科院智能所评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆;;多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 姚天顺;杨莹;;关于机器翻译的评测问题[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 何彦青;石崇德;于薇;张均胜;王惠临;;中国科学技术信息研究所CWMT'2011技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 希夏姆.马利克;;汉阿机译研究(一) 从汉语单句若干结构谈论汉阿机译[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 肖桐;张浩;李强;路琦;朱靖波;任飞亮;王会珍;;CWMT2011东北大学参评系统NiuTrans介绍(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
8 麦热哈巴.艾力;米日古.肉孜;撒依达;江阿古丽;吐尔根.伊布拉音;;新疆大学CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
9 赵红梅;吕雅娟;贲国生;黄云;刘群;;第七届全国机器翻译研讨会(CWMT2011)评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 李贤华;郑仲光;孟遥;于浩;;第七届全国机器翻译研讨会(CWMT2011)富士通研究开发中心技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 凌子浪;机器翻译的未来不可估量[N];计算机世界;2001年
2 《中国电脑教育报》记者 晨风;机器翻译如何是好?[N];中国电脑教育报;2001年
3 赵迎华;机器翻译如何是好[N];光明日报;2001年
4 ;机器翻译在电子政务系统建设中的应用[N];中国电脑教育报;2004年
5 ;机器翻译 在电子政务系统建设中的应用[N];中国电脑教育报;2004年
6 刘 莎;语义约定全文翻译: 机器翻译的“日心说”?[N];计算机世界;2002年
7 何艳霞;韩国完善专利信息系统机器翻译和英文检索功能[N];中国知识产权报;2007年
8 刘仁;“语义分析”升级专利机器翻译[N];中国知识产权报;2008年
9 李佳师;拓展嵌入式空间 中软可借力微软[N];中国电子报;2007年
10 刘素元、艾文;给机器翻译装上“大脑”[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
2 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
3 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
4 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
5 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
6 雒自清;语义块类型、构成及变换的分析与处理[D];中国科学院研究生院(声学研究所);2004年
7 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
8 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
9 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
10 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 李平;基于Internet的人机互助机器翻译技术的研究[D];内蒙古大学;2012年
2 惠聪;机器翻译中的高级对齐技术和开发集选择策略研究[D];上海交通大学;2012年
3 朱晓宁;基于语言学知识的机器翻译自动评价研究[D];哈尔滨工业大学;2011年
4 计丽丽;基于混合策略的机器翻译研究[D];安徽理工大学;2012年
5 王内;文学材料和非文学材料机器翻译适用性比较研究[D];湖南师范大学;2012年
6 陈亮;基于英汉平行语料库的机器翻译知识获取研究[D];北京交通大学;2012年
7 朱俊国;机器翻译自动评价计算粒度研究[D];哈尔滨工业大学;2010年
8 麦丽开·阿布德瓦力;面向机器翻译的汉维词语对齐规范[D];新疆大学;2012年
9 赵小曼;英汉平行语料库句子级对齐研究及其在机器翻译中的应用[D];安徽大学;2010年
10 李志青;基于Internet的互动辅助翻译技术研究[D];内蒙古大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026