汉语越南语机器翻译实验系统
【摘要】:
本文是面向语言工程的,主要阐述汉语越南语机器翻译实验系统HanViet 0.1的理论基础和实现过程。据我们所知,这是第一个汉越机器翻译系统。
本文一共分为5章。
第1章简要回顾了中国和越南机器翻译的历史和现状,阐述我们开发汉越机器翻译系统的必要性、可行性和优势,最后给出了系统的构建原则。
第2章阐述系统的总体构架及机器翻译的流程。
第3章详细讨论翻译引擎的各个模块。翻译引擎包括3大部分:分析、转换、生成。其中分析部分由汉语词法分析模块、汉语句法分析模块组成,转换部分由汉越句法转换模块、汉越词法转换模块组成,生成部分由越语句法生成模块、越语词法生成模块组成。
第4章讨论系统各部分目前存在的问题及可能的解决办法,并指出语义分析和面向对象编程范式是下一步的主要努力方向。
第5章是对我们开发机器翻译实验系统的一个小结。
机器翻译系统的设计与实现是一项浩大的工程,它必须通过最低限度的开发成本来实现,否则将一事无成(Jurafsky2000)。因时间、资源及学识所限,HanViet 0.1所采用的方法未必是最理想的。因而本文虽主要探讨HanViet 0.1的理论和实现,但也涉及了相当多的那些可能更好但因条件所限而没有采用的方法,以及对该系统的进一步改进方案。