基于英汉平行语料库的机器翻译知识获取研究
【摘要】:随着互联网信息资源的不断膨胀,人们可以通过互联网获取的资源也日益增加。目前世界上已知的语言约有3000多种,机器翻译及机器翻译知识的自动获取研究对人们突破语言障碍,充分利用互联网信息具有很强的现实意义。
本文主要围绕以下几个方面进行了深入的研究:
1)词汇对齐。词汇对齐是从英汉平行语料库中,根据已有的句子级对齐的语料库,挖掘出词汇级的英汉词对应关系。对机器翻译、语义消歧、翻译词典获取以及跨语言信息检索等都具有重要的意义。
2)短语对齐。短语对齐能够反映出平行句对在短语级别上的对应关系,短语对齐也是机器翻译知识获取领域的一个重要研究工作。
3)句法结对齐。句法结构对齐是对双语句法结构树进行分析和总结,提取出双语句子在句法结构以及句子成分上的对应关系。句法结构对齐的结果能够直接应用于短语对齐的工作中。
4)机器翻译知识的应用。通过对双语平行语料库的知识挖掘,并且运用到机器翻译中,进行翻译前后的对比,可以看出机器翻译知识获取对机器翻译的质量的改善。
研究取得的主要成果如下:
1)在词对齐方面,我们提出了基于N-Gram语言模型的多词对齐算法,有效的解决了对于词对齐过程中存在的一对多和多对多的对齐问题。并且实现了一个有效的英汉、汉英双语翻译词典。
2)在短语对齐方面,鉴于句子结构的复杂性,我们提出了分类短语对齐的思想,把短语对齐分成了名词性短语、动词短语、形容词性短语以及副词短语。实验结果显示分类词对齐能够很好的提高短语对齐的准确性。同时,设计了一个能够提取双语短语互译单元的系统。
3)建立了一个完整的基于英汉双语平行语料库的机器翻译知识获取系统。
|
|
|
|
1 |
冯志伟;;机器翻译和人机对话中语言自动分析的新方法[J];情报科学;1987年01期 |
2 |
杨宪泽;肖明;;转换式机器翻译过程的相关处理研究[J];电脑与电信;2008年09期 |
3 |
袁琦;中文信息技术和自然语言处理[J];中文信息学报;1986年01期 |
4 |
王挺;陈火旺;史晓东;;语料库和机器翻译[J];计算机科学;1996年02期 |
5 |
冯志伟;;机器翻译今昔谈[J];金秋科苑;1997年04期 |
6 |
李剑
,王波
,郭永辉
,王炳锡;英汉机器翻译中基于模式的译文生成[J];微计算机信息;2005年20期 |
7 |
;计算机检索、机器翻译编辑、自动标引、自动文摘等[J];电子科技文摘;2006年02期 |
8 |
张健青;贾欣岚;;英汉机器翻译中一些问题的探讨[J];术语标准化与信息技术;2008年04期 |
9 |
史晓亮;;英汉机器翻译中语言陷阱的自动检索标识方法[J];科技信息;2011年03期 |
10 |
龚文涛,徐国桓,武立莹,刘会霞,张世红;信息检索技术的发展概况及趋势[J];医学情报工作;2001年03期 |
11 |
黄德根;刘小华;李丽双;;汉英机器翻译中趋向动词处理研究[J];大连理工大学学报;2006年05期 |
12 |
;新品速递[J];中国传媒科技;2006年10期 |
13 |
王献昌;史晓东;陈火旺;;机器翻译与自然语言处理的现状与趋势[J];计算机科学;1992年03期 |
14 |
刘海涛;;机器翻译中的语篇连贯问题[J];情报科学;1992年03期 |
15 |
于中华,唐常杰,张天庆,朱敏,廖果,李志蜀,沙芦华;“信译”英汉机器翻译系统的语法分析策略[J];小型微型计算机系统;2000年03期 |
16 |
史树敏;机器翻译方法的研究现状[J];内蒙古师范大学学报(自然科学汉文版);2004年02期 |
17 |
杨宪泽,雷开彬,吴守宪,张上游,宁爱华;一种句型转换和近似机器翻译方法及算法[J];计算机工程与科学;2005年11期 |
18 |
杨洵;;电子翻译工具实用漫谈[J];中国招标;2008年24期 |
19 |
王清;殷业;;基于Globish的旅游用英汉翻译系统的研究[J];企业科技与发展;2008年12期 |
20 |
张少恩;;论语境因素在机器翻译中的重要作用[J];农业网络信息;2008年07期 |
|