收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于Internet的互动辅助翻译技术研究

李志青  
【摘要】:机器翻译的研究由来已久,但尚未能完全达到人类期望的目标。随着计算机软硬件技术的高速发展,以及语料库建设的完善,利用统计知识的机器翻译成为可能,翻译质量有望离人类的期望更近一步。自噪声信道模型,尤其是最大熵模型提出以来,机器翻译的一个中心任务是如何在模型中融入更有效的知识,以进一步提高机器翻译的质量。本文聚焦于中英文之间的机器翻译问题,针对如何有效地在基于中英双语语料库的机器翻译中结合用户评分进行了一系列深入的研究。 首先,网络爬虫是一个自动提取网页的程序,我们利用它从Internet上下载相对应的网页,得到训练需要的汉英平行语料库,存到数据库里。由于汉语是以字为基本的书写单位,词语之间没有明显的区分标记。因此,中文词语分析是中文信息处理的基础与关键。其中中文的分词,我们采用了现有的中国科学院计算技术研究所研制出的汉语词法分析系统ICTCLAS(Institute of Computing Technology. Chinese Lexical Analysis System)。而英语句子中本身就是分好的词,我们只进行了大小写转化和标点符号的分离处理。 其次,从Internet上获取回汉英平行语料,并对中英文进行处理后,对每一个翻译句子进行人工评分。评分为很好、好、一般、较差、很差五个等级。语料的获取和评分的截图见附录。然后,我们将不同的人评分的结果求得一个平均值,与统计翻译里的共现概率相乘得到最后的翻译概率,这个概率形成我们最后用Moses解码时的翻译概率表。 最后,我们利用开源的基于统计的机器翻译的Moses解码器,在此基础上加入trigger对英语语言模型、结合用户评分的翻译模型以及汉英调序模型,对语料库中出现的数据稀疏现象进行平滑。实验结果表明,翻译结果是合理的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴龙生;INTERNET的服务功能[J];现代通信;1995年12期
2 常卫国;正确选择INTERNET服务供应商[J];通讯世界;1996年05期
3 何小清;论图书馆参与因特网信息资源的建设与管理[J];图书与情报;1998年03期
4 肖昕;不要一窝蜂上INTERNET网[J];情报资料工作;1998年02期
5 李健,李越中;Internet与生命科学[J];自然杂志;1998年03期
6 陆瑾;Internet Telephony的现状及其发展[J];电子技术;1998年12期
7 田虎;INTERNET离我们还有多远?[J];新闻出版交流;1998年06期
8 张捷;从INTERNET共享MEDLINE资源[J];徐州医学院学报;1998年06期
9 刘惠,贾焰,窦文;基于Internet的构件化管理信息集成平台ICM IIP的研究与实现[J];国防科技大学学报;1999年06期
10 邓劲生,赵振宇;使用IC卡管理Internet开放实验室[J];计算机应用研究;1999年10期
11 詹庆东;Internet环境下图书馆自动化的新特点[J];情报杂志;1999年04期
12 文沙安;在Internet上查找Medline[J];图书馆论坛;1999年04期
13 易丽;对培育南宁信息市场的思考[J];广西通信技术;1999年03期
14 唐敦兵,李东波,张世琪;敏捷制造环境下基于Internet的CAD/CAM系统研究[J];机电一体化;1999年02期
15 裘江南,金玉玲;基于WWW技术对传统信息系统改造的对策和方法[J];微型机与应用;1999年03期
16 武志勇;局域网站快速连接INTERNET的新方法[J];广东广播电视大学学报;1999年02期
17 牛改芳,李晓红;网络环境下信息资源的建设[J];情报杂志;2000年04期
18 鲜朝,韩晓红;INTERNET中的师范教育信息资源[J];甘肃高师学报;2000年05期
19 董树森,陈玉华,刘丽英;Internet上的信息安全及防范措施[J];黑龙江水专学报;2000年04期
20 方昌盛;浅谈计算机网络和INTERNET[J];采矿技术;2000年Z3期
中国重要会议论文全文数据库 前10条
1 姚天顺;杨莹;;关于机器翻译的评测问题[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 奚宁;赵迎功;汤光超;李中华;刘友强;戴新宇;陈家骏;;南京大学第七届机器翻译研讨会评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
3 何彦青;石崇德;于薇;张均胜;王惠临;;中国科学技术信息研究所CWMT'2011技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
4 梁芳丽;陈雷;李淼;何绵涛;刘绘;;第七届全国机器翻译研讨会中科院智能所评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 希夏姆.马利克;;汉阿机译研究(一) 从汉语单句若干结构谈论汉阿机译[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 肖桐;张浩;李强;路琦;朱靖波;任飞亮;王会珍;;CWMT2011东北大学参评系统NiuTrans介绍(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
7 麦热哈巴.艾力;米日古.肉孜;撒依达;江阿古丽;吐尔根.伊布拉音;;新疆大学CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
8 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆;;多语言文本机器翻译系统——中科院自动化所CWMT2011评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
9 李贤华;郑仲光;孟遥;于浩;;第七届全国机器翻译研讨会(CWMT2011)富士通研究开发中心技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
10 赵红梅;吕雅娟;贲国生;黄云;刘群;;第七届全国机器翻译研讨会(CWMT2011)评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
2 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
3 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
4 张君;Internet路由级拓扑结构之k-核解析及其建模[D];东北大学;2009年
5 尹可挺;Internet环境中基于QoS的Web服务组合研究[D];浙江大学;2010年
6 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
7 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
8 朱红;面向Internet的视频编码技术研究[D];西安电子科技大学;2005年
9 吴吉庆;面向Internet的时序数据快速分发技术研究[D];国防科学技术大学;2011年
10 高永生;基于Internet多机器人遥操作系统安全机制的研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 苏海霞;基于Internet的自动化设备远程监控系统设计[D];河北大学;2010年
2 王胜云;INTERNET招投标运作方式研究[D];河海大学;2001年
3 孙凡;基于INTERNET的自动语音应答系统的研究和实现[D];太原理工大学;2002年
4 郑斌;嵌入式Internet应用于信息家电的研究与实现[D];长沙理工大学;2004年
5 曾炜;基于Internet的火灾报警控制器远程监控系统[D];华中科技大学;2005年
6 连东坡;基于Internet的济南陆军学院函授教务管理系统[D];山东大学;2005年
7 贾笑飞;INTERNET上的相关数据库技术研究及应用[D];郑州大学;2001年
8 周瑛;INTERNET环境下的多媒体技术研究[D];北京工业大学;2003年
9 王秀花;基于Internet的连锁门店营销系统的设计与实现[D];山东大学;2010年
10 李志青;基于Internet的互动辅助翻译技术研究[D];内蒙古大学;2011年
中国重要报纸全文数据库 前10条
1 IDG电讯;赢利的欧洲Internet公司增多[N];计算机世界;2001年
2 马丁·库珀;电信的困境与发展[N];中国计算机报;2001年
3 李田养;将GIS引入Internet世界[N];计算机世界;2002年
4 ;自主运算网络[N];中国计算机报;2001年
5 李力林;书写“INTERNET第二章”[N];国际商报;2000年
6 ;细分市场和Internet催生新的显示产品[N];科技日报;2001年
7 本报记者 姜艳青;亚信:甘做Internet铺路人[N];通信产业报;2000年
8 李文龙;浅谈第二代Internet[N];人民政协报;2000年
9 成都 张晋飞;让你的Mailto更聪明[N];电脑报;2003年
10 佳师;康柏Internet新灵感[N];中国电子报;2000年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978