汉字语法语义智能输入法总体设计与部分实现
【摘要】:
中文信息处理是利用计算机对汉语信息进行自动处理,其中解决汉字输入是该领域内一项基础而又重要的工作。虽然已经有不依靠键盘输入汉字的产品问世,但汉字键盘输入法还是最普及的方式,也是中文信息处理领域中一个很重要的课题。为了提高输入法的智能性,设计实现了汉字语法语义智能输入法。本文在对现有输入法分析的基础上,给出了一个汉字输入法的总体设计,讨论了在Windows平台上设计实现输入法涉及到的具体技术,同时研究了非完整句子切分问题,最后给出输入法的部分实现。主要工作有:
1、设计汉字语法语义智能输入法的总体框架。本文设计的输入法通过引入智能处理技术,提高输入法的智能特性。在整个框架中,将输入法系统按照功能分成模块。其中输入法智能性的输入转换模块相对独立,可以加载到其他现有输入法中,使这些输入法也具有智能的特性。
2、对Windows平台上输入法实现技术进行了深入的研究。首先从输入法挂接技术入手,讨论了Windows平台上不同的挂接方法。输入法管理-输入法编辑器(IMM-IME)结构是中文Windows操作系统多语言支持的核心组件之一,为输入法的开发提供了强有力的支持。讨论了IMM-IME的基本工作原理、特点,详细分析了基于IMM-IME结构的输入法的构成、接口、设计思想以及一些重要核心技术。
3、研究并实现非完整句子的切分标注。针对汉字语法语义输入法的需要,提出对非完整句子的切分标注的问题。在分析了句子非完整性对切分的影响后,对现有的分词系统做局部修改,使之能够处理非完整句子。该子系统在输入法中以DLL的方式调用,切分的结果用于减少候选字词和预测后续输入的字词。
4、输入法系统部分模块的实现。对系统实现时需要的关键技术进行研究,实现了系统的整体框架、系统初始化、按键事件处理、安装程序等模块。