基于特征字符的印刷体公式识别研究
【摘要】:随着计算机和互联网的普及,人们越来越多地使用计算机存储和传输信
息。但如何提高信息的传输速率成了一个亟待解决的问题。为了解决这些问
题需要研究有效和实用的方法来将文本形式的文件转变为相应的电子格式的
文件,这是一种能够被当代的数字计算机处理并通过互联网输送的方式。通
过计算机来自动识别字符,是将由字符组成的文本高速录入计算机的唯一可
行方法。目前广泛应用的OCR系统对手写、印刷体文本都有很高的识别率,
但是对公式却一直没有好的识别方案,公式识别成为模式识别领域一个研究
的热点。
公式识别按照公式书写格式的不同可以分为印刷体公式识别和手写体公
式识别,本课题研究的是印刷体数学公式识别。我们研究一种新的、基于特
征字符的印刷体公式识别方法,并开发完整的算法,将印刷体的数学公式(图
像格式)转换成可编辑的电子格式。
按照系统的设计与开发方案,本文主要分为以下四个部分:
公式图片的预处理。我们获得的待识别公式图片大多含有噪声,是没有
进行过二值化、细化、大小归一化等方法处理的图片,直接进行识别难度较
大,这样,我们首先需要进行图像预处理的工作。
字符的分割和识别。我们得到的待识别图片是一个整体的公式,需要知
道公式包含的各个字符以及各个字符之间的位置关系,这样,我们就需要分
割出公式包含的字符以及识别这些字符。本文采用基于连同域方法完成字符
的分割,并采用模板匹配的方法进行字符识别。
公式的结构分析。得到公式包含的字符类别信息和位置信息后,我们采
用基于特征字符的方法进行结构分析,这是本文的核心部分,在提出结构分
析方法的基础上,我们开发公式识别的算法。在这一部分还给出Word EQ域
语法的使用方法,并用它表达结构分析的结果。
软件的设计与实验。给出公式识别DEMO程序的结构、主要函数、界面
并最后给出实验示例和实验结果。