统计机器翻译中树到串对齐模板模型系统实现和比较研究
【摘要】:
统计机器翻译使用统计方法自动地把一种自然语言的文本转换成另一种自然语言的文本。最近,统计机器翻译研究者开始关注融合语言学信息的翻译模型。在这些模型中,基于树到串对齐模板的翻译模型是一种很好的代表。
首先,本文对受句法指导的树到串对齐模板模型进行了较为全面的论述,并实现了基于树到串对齐模板模型的解码器。详细讨论了树到串对齐模板模型的形式化定义、参数估计和解码方法。同时,为了加速树到串对齐模板模型的解码速度,使用了立方体剪枝策略。
其次,对树到串对齐模板模型进行了实证分析。将树到串对齐模板模型和短语模型在三个方面上进行了详细地对比。第一,树到串对齐模板模型的生成能力更强,能够表达语言中常见的非连续搭配问题。第二,树到串对齐模板模型在处理长距离调序问题上比短语模型更有优势。第三,树到串对齐模板模型不能表达非句法连续短语。最后,使用Moses做为对比系统在NIST-2005和NIST-2008 MT测试集上对解码器进行了实验验证。
最后,对基于统计方法的音译汉英外国人名进行了探索。第一,讨论了常见的统计音译方法分类,详细介绍了基于序列化标注模型和基于噪声信道模型的两种音译模型。第二,通过充分的实验比较得出结论:对基于噪声信道方法的音译模型而言,汉语应该以汉字为基本单位,通过音节化英文人名能够在低阶语言模型上获得更好的翻译性能。第三,通过重排序的方法可以极大地提升模型的性能。
|
|
|
|
1 |
马靖然;使用Word XP的几点技巧[J];中国科技信息;2005年14期 |
2 |
黄辉;;一种线材对齐卸卷的方法[J];科技传播;2011年17期 |
3 |
刘昕,周明,朱胜火,黄昌宁;基于自动抽取词汇信息的双语句子对齐[J];计算机学报;1998年S1期 |
4 |
吴绘萍;吴清芳;;Word中表格复制时行对齐的问题[J];电脑知识与技术;2005年31期 |
5 |
;Excel分散对齐的妙用[J];工会博览(社会版);2007年03期 |
6 |
江诗锋;何振峰;;基于特征点的行车数据序列对齐[J];福州大学学报(自然科学版);2010年02期 |
7 |
赵翠萍;;关于教材编写过程中图片的处理[J];职业教育研究;2011年06期 |
8 |
王斌,刘群,张祥;汉英双语库自动分段对齐研究[J];软件学报;2000年11期 |
9 |
卢光跃,保铮;ISAR成像中具有游动部件目标的包络对齐[J];系统工程与电子技术;2000年06期 |
10 |
丁健,周游,江南,张万军;应用程序“右顺序对齐菜单”编程方法[J];计算机系统应用;2002年03期 |
11 |
小渔;数字按小数点对齐[J];电脑迷;2004年07期 |
12 |
刘爱芳,李彧晟,朱晓华;用改进的包络最小熵法进行包络对齐[J];信号处理;2005年01期 |
13 |
王大鹏;姜怡;姜欣;;语料库在茶典籍英译中的实例应用[J];沈阳师范大学学报(自然科学版);2010年02期 |
14 |
禹龙;田生伟;杨飞宇;;汉维语短语搭配的识别和对齐[J];计算机应用与软件;2011年06期 |
15 |
周玉,宗成庆,徐波;基于多层过滤的统计机器翻译[J];中文信息学报;2005年03期 |
16 |
冉计全,樊晓桠,孙华锦,李大伟;RISC微处理器中存取部件设计的一种优化方法[J];计算机工程与应用;2005年05期 |
17 |
冯志伟;;机器翻译与语言研究(下)[J];术语标准化与信息技术;2007年04期 |
18 |
梁华参;赵铁军;薛永增;孙加东;;词汇相似度约束的短语抽取[J];哈尔滨工业大学学报;2010年05期 |
19 |
郎君;;统计机器翻译中翻译模型的约简概述[J];智能计算机与应用;2011年03期 |
20 |
张国柱;Word中的对齐技术[J];电脑爱好者;1998年16期 |
|