收藏本站
《电子科技大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

Corpus-Based Machine Translation of WebPages--A Suggestion on MT Model and Strategy to Disambiguation

陆正海  
【摘要】:机器翻译已经经历了将近60的发展,虽然中间有波折,还是取得了显著的成就。随着互联网的普及,网络已经成为了一种新的媒体,是人们获取信息的重要途径。但是在国际互联网上,大部分信息都是以英语作为媒介语言的,这必然对以汉语为母语的我们造成一定的信息获取障碍。虽然国内外已有很多公司致力于网页机器翻译系统的研究,这其中也包括很多涉及到英文—中文翻译,但是其结果总是不尽如人意。 笔者首先简要介绍了机器翻译的历史,现状,比较了人机翻译的各自特点,从而指出了在信息时代中大力发展机器翻译的重要作用。 在讨论了网页的特点及组成之后,笔者提出了一种模型,用来解决在网页翻译中出现的困难。网页翻译实际上可以看成是两部分的组合:有标记文本和纯文本的翻译。针对前者,作者首先将网页设计中的标记进行分类,从而采取不同的措施,并提出了一个四步法将其正确的反映在译文当中。而对于纯文本的翻译,作者首先提出了一个域的选择,并以此提出了以语料库为基础的一个翻译模型, 但是在网页翻译过程中不可避免的出现了歧义的问题,这是任何一个机器翻译系统都必须面对的。本文首先分析了存在的几种歧义,再分别对待。对于翻译标记文本中出现的歧义,基本上在第一个模型当中就已经得到了解决。因此笔者将重点放到了纯文本翻译中的歧义问题解决上,并提出了一种以完善语料库为基础的消除歧义的方法。将这两者有机的结合在一起,才可以说是真正提高机器翻译的质量。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:H085.5

手机知网App
【参考文献】
中国硕士学位论文全文数据库 前2条
1 叶君梅;英汉机器翻译中的歧义及消歧策略[D];广西师范大学;2002年
2 杨晓峰;汉英机器翻译系统中的一种语义排岐模型研究[D];厦门大学;2001年
【共引文献】
中国硕士学位论文全文数据库 前4条
1 朱会娟;基于形式概念分析的英语情态动词May语义排歧研究[D];燕山大学;2012年
2 骆忠武;外交歧义:特点及翻译[D];上海外国语大学;2010年
3 汤小娜;词义消歧在统计机器翻译中的应用研究[D];厦门大学;2007年
4 陆正海;Corpus-Based Machine Translation of WebPages--A Suggestion on MT Model and Strategy to Disambiguation[D];电子科技大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 陆正海;;基于语料库的网页机器翻译[J];安徽文学(下半月);2014年12期
2 汪云;周大军;;基于语料库的机器翻译的现状与展望[J];考试与评价(大学英语教研版);2017年05期
3 李亮;基于语料库的机器翻译[J];上海科技翻译;2004年02期
4 龙从军;;藏语文本信息处理的几个关键问题[J];科研信息化技术与应用;2012年04期
5 孙懿;胡永;陈蓉;陈烽;刘源;;两种英汉机器翻译技术研究[J];福建电脑;2014年03期
6 李建平;;机器翻译技术在高校后勤信息系统中的应用[J];高校后勤研究;2010年06期
7 陆正海;;网页的机器翻译[J];科技信息;2008年31期
8 宋仕振;;试论机器翻译与人工翻译的未来关系[J];未来与发展;2019年02期
9 陈丹;;浅析语料库对于翻译研究的意义[J];科技视界;2013年34期
10 梁三云;机器翻译与计算机辅助翻译比较分析[J];外语电化教学;2004年06期
中国重要会议论文全文数据库 前10条
1 吐尔根·依布拉音;阿里甫·库尔班维尼拉·木沙江;;面向汉维机器翻译的双语对齐语料库设计与实现[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
2 冯志伟;;机器翻译:从基于规则的技术到基于统计的技术[A];2010年中国翻译职业交流大会论文集[C];2010年
3 牛其其日乐格;;蒙汉机器翻译中数词自动翻译的研讨[A];“决策论坛——企业行政管理与创新学术研讨会”论文集(下)[C];2016年
4 池毓焕;李颖;;面向汉英机器翻译的大句范式初探[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 韦燕;卜朝晖;;日语提示助词“こそ”的日中机器翻译规则[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 胡金铭;甘兴超;陈毅东;史晓东;;第七届机器翻译研讨会厦门大学技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
7 那顺乌日图;刘群;巴达玛敖德斯尔;;面向机器翻译的蒙古语生成[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 史晓东;;英汉机器翻译:现状和未来[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 史晓东;;汉英机器翻译中离合词的处理[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
10 侯敏;孙建军;;基于汉英机器翻译的名词回指分析——句组研究之二[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前10条
1 《中国电脑教育报》记者 晨风;机器翻译如何是好?[N];中国电脑教育报;2001年
2 熊德意何中军 刘群;机器翻译渐行渐近[N];计算机世界;2007年
3 赵迎华;机器翻译如何是好[N];光明日报;2001年
4 浙江大学 李恒威 教授 王昊晟 博士;高质量的机器翻译近在咫尺?[N];社会科学报;2018年
5 微软亚洲研究院副院长 周明;四大领域揭示自然语言技术的奥秘[N];中国信息化周报;2018年
6 本报记者 韩小乔;“机器翻译不久将发展到上百个语种”[N];安徽日报;2018年
7 记者 金晓玲;机器翻译界“跑”出沈阳“小牛”[N];辽宁日报;2018年
8 杨骏;机器翻译革命强势来袭[N];中华工商时报;2018年
9 本报记者 徐蔚冰;阿里达摩院升级机器翻译 48种语言促天猫双11国际化[N];中国经济时报;2018年
10 本报记者 袁于飞;大数据时代:机器翻译能否取代人工[N];光明日报;2016年
中国博士学位论文全文数据库 前10条
1 麦热哈巴·艾力;基于实例的维汉机器翻译若干关键问题研究[D];新疆大学;2014年
2 武静;多方法融合蒙汉机器翻译与译文重排序研究[D];内蒙古大学;2017年
3 Samira Chaabna(莎米娜);基于挖掘用户生成内容的产品搜索引擎设计[D];武汉理工大学;2015年
4 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
5 田兵;义项的区分与描写[D];广东外语外贸大学;2004年
6 杨朝军;英语左偏置构式:功能视角[D];河南大学;2006年
7 王瑞昀;英汉疑问句类型学比较研究[D];上海外国语大学;2005年
8 王祥玉;汉英句型翻译的认知学研究[D];上海外国语大学;2007年
9 陈莉萍;英汉语篇结构标注理论与实践[D];上海外国语大学;2007年
10 廖涛;面向事件的文本表示及其应用研究[D];上海大学;2014年
中国硕士学位论文全文数据库 前10条
1 陆正海;[D];电子科技大学;2004年
2 贺靓;基于语料库的机器翻译可行性分析[D];湖南工业大学;2010年
3 周昕烨;汉英机器翻译在商务文本翻译中的应用[D];华东师范大学;2013年
4 殷乐;基于语料库的机器翻译中翻译知识的获取[D];北京交通大学;2014年
5 李亚洲;文本分类语料库自动构建系统的研究与改进[D];武汉理工大学;2011年
6 郑晨晖;基于语料库的企业道歉文本体裁分析[D];广东外语外贸大学;2015年
7 徐晴阳;从网页中精确提取链接上下文相关文本[D];吉林大学;2004年
8 王岚;通过人机翻译对比分析寻找英译汉的最佳方法[D];西安工程大学;2012年
9 吴溢;汉英机器翻译对比研究[D];浙江大学;2009年
10 麦丽开·阿布德瓦力;面向机器翻译的汉维词语对齐规范[D];新疆大学;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026