收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

统计机器翻译中树到串对齐模板模型系统实现和比较研究

张春越  
【摘要】: 统计机器翻译使用统计方法自动地把一种自然语言的文本转换成另一种自然语言的文本。最近,统计机器翻译研究者开始关注融合语言学信息的翻译模型。在这些模型中,基于树到串对齐模板的翻译模型是一种很好的代表。 首先,本文对受句法指导的树到串对齐模板模型进行了较为全面的论述,并实现了基于树到串对齐模板模型的解码器。详细讨论了树到串对齐模板模型的形式化定义、参数估计和解码方法。同时,为了加速树到串对齐模板模型的解码速度,使用了立方体剪枝策略。 其次,对树到串对齐模板模型进行了实证分析。将树到串对齐模板模型和短语模型在三个方面上进行了详细地对比。第一,树到串对齐模板模型的生成能力更强,能够表达语言中常见的非连续搭配问题。第二,树到串对齐模板模型在处理长距离调序问题上比短语模型更有优势。第三,树到串对齐模板模型不能表达非句法连续短语。最后,使用Moses做为对比系统在NIST-2005和NIST-2008 MT测试集上对解码器进行了实验验证。 最后,对基于统计方法的音译汉英外国人名进行了探索。第一,讨论了常见的统计音译方法分类,详细介绍了基于序列化标注模型和基于噪声信道模型的两种音译模型。第二,通过充分的实验比较得出结论:对基于噪声信道方法的音译模型而言,汉语应该以汉字为基本单位,通过音节化英文人名能够在低阶语言模型上获得更好的翻译性能。第三,通过重排序的方法可以极大地提升模型的性能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马靖然;使用Word XP的几点技巧[J];中国科技信息;2005年14期
2 黄辉;;一种线材对齐卸卷的方法[J];科技传播;2011年17期
3 刘昕,周明,朱胜火,黄昌宁;基于自动抽取词汇信息的双语句子对齐[J];计算机学报;1998年S1期
4 吴绘萍;吴清芳;;Word中表格复制时行对齐的问题[J];电脑知识与技术;2005年31期
5 ;Excel分散对齐的妙用[J];工会博览(社会版);2007年03期
6 江诗锋;何振峰;;基于特征点的行车数据序列对齐[J];福州大学学报(自然科学版);2010年02期
7 赵翠萍;;关于教材编写过程中图片的处理[J];职业教育研究;2011年06期
8 王斌,刘群,张祥;汉英双语库自动分段对齐研究[J];软件学报;2000年11期
9 卢光跃,保铮;ISAR成像中具有游动部件目标的包络对齐[J];系统工程与电子技术;2000年06期
10 丁健,周游,江南,张万军;应用程序“右顺序对齐菜单”编程方法[J];计算机系统应用;2002年03期
11 小渔;数字按小数点对齐[J];电脑迷;2004年07期
12 刘爱芳,李彧晟,朱晓华;用改进的包络最小熵法进行包络对齐[J];信号处理;2005年01期
13 王大鹏;姜怡;姜欣;;语料库在茶典籍英译中的实例应用[J];沈阳师范大学学报(自然科学版);2010年02期
14 禹龙;田生伟;杨飞宇;;汉维语短语搭配的识别和对齐[J];计算机应用与软件;2011年06期
15 周玉,宗成庆,徐波;基于多层过滤的统计机器翻译[J];中文信息学报;2005年03期
16 冉计全,樊晓桠,孙华锦,李大伟;RISC微处理器中存取部件设计的一种优化方法[J];计算机工程与应用;2005年05期
17 冯志伟;;机器翻译与语言研究(下)[J];术语标准化与信息技术;2007年04期
18 梁华参;赵铁军;薛永增;孙加东;;词汇相似度约束的短语抽取[J];哈尔滨工业大学学报;2010年05期
19 郎君;;统计机器翻译中翻译模型的约简概述[J];智能计算机与应用;2011年03期
20 张国柱;Word中的对齐技术[J];电脑爱好者;1998年16期
中国重要会议论文全文数据库 前10条
1 田亮;黄辉;周沁;;面向短语的词语对齐方法[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
2 罗维;吉宗诚;吕雅娟;刘群;;一种改进词语对齐的新方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 朱海;李淼;张建;乌达巴拉;;系统融合方法在汉蒙统计机器翻译上的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 王春荣;宝美荣;王斯日古楞;;内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
5 巢文涵;李舟军;;ZZX_MT系统CWMT2011评测报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
6 周玉;宗成庆;徐波;;基于多层过滤的统计机器翻译[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 杜金华;王莎;;西安理工大学统计机器翻译系统技术报告(英文)[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
8 张育;李良友;贡正仙;周国栋;;粘贴模型在依存语法统计机器翻译中的应用[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 何彦青;周玉;宗成庆;;基于“松弛尺度”的短语翻译对抽取方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 于东;贾磊;徐波;;面向语音识别错误恢复的澄清式疑问句生成[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前10条
1 黄书剑;统计机器翻译中的词对齐研究[D];南京大学;2012年
2 蒋宏飞;基于同步树替换文法的统计机器翻译方法研究[D];哈尔滨工业大学;2010年
3 段楠;统计机器翻译的一致性解码方法研究[D];天津大学;2012年
4 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
5 马延军;干扰对齐及其在现代无线通信系统中的应用[D];西安电子科技大学;2012年
6 陈毅东;基于短语的统计机器翻译模型若干关键技术研究[D];厦门大学;2008年
7 李海艳;面向反求工程的多传感器集成及数据融合技术研究[D];华中科技大学;2010年
8 薛永增;统计机器翻译若干关键技术研究[D];哈尔滨工业大学;2007年
9 卢光跃;逆合成孔径雷达(ISAR)成像技术的改进[D];西安电子科技大学;1999年
10 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘建明;基于统计机器翻译的汉维词对齐研究[D];新疆大学;2010年
2 张春越;统计机器翻译中树到串对齐模板模型系统实现和比较研究[D];哈尔滨工业大学;2010年
3 李函章;统计机器翻译中语料选择方法研究[D];黑龙江大学;2010年
4 张育;基于依存语法的统计机器翻译研究[D];苏州大学;2011年
5 张涛;面向特定领域的统计机器翻译研究与应用[D];昆明理工大学;2011年
6 狄萍;基于短语的统计机器翻译的研究[D];苏州大学;2010年
7 王志杰;统计机器翻译系统在手持设备上的研究与实现[D];内蒙古大学;2012年
8 李文;形态非对称汉蒙统计机器翻译模型构造方法研究[D];中国科学技术大学;2011年
9 宋美娜;基于词缀特征的汉蒙统计机器翻译系统[D];内蒙古大学;2010年
10 李天宁;词对齐技术研究及统计机器翻译平台的构建[D];东北大学;2009年
中国重要报纸全文数据库 前10条
1 宋志明;显示对象快速对齐[N];中国电脑教育报;2003年
2 蔡峻;也看Word中的对齐问题[N];中国电脑教育报;2004年
3 宗建华 李彤 朱华昌;和竞争对手一起赚钱 [N];中国石化报;2003年
4 许向前;巧用表格让选择题选项对齐[N];中国电脑教育报;2003年
5 徐育兵;完形填空选项巧对齐[N];电脑报;2003年
6 丁健 张万军 江南;右顺序对齐菜单实现方法[N];计算机世界;2001年
7 陶锦云;巧用制表符让选项对齐[N];中国电脑教育报;2003年
8 本报记者 李守苓;暑假打工现象你怎么看[N];中国石化报;2001年
9 本报记者 许立群;齐晖:在否定中成长[N];人民日报;2003年
10 刘丽芳;省人大调研组结束对齐调研[N];齐齐哈尔日报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978