地图图符提取与识别算法研究
【摘要】:地形图计算机自动输入识别技术是一个国际上公认的难题,是地图信息自动化管理和地图出版计算机自动化的关键技术。地理信息系统中数据库的管理技术已相对较为成熟,而数据的获取成为其发展的瓶颈。地形图图符粗分类有十几种,本文选取其中使用最频繁但自动识别难度最大的等高线图符、点状图符、汉字注记图符作为研究对象,并准备把其有效的方法推广到其它图符,来完成有关图符的提取与识别工作。而地形图的比例尺也有很多种。1∶5万的地形图信息密度最大。其他几种比例的地形图能从1∶5万地形图中得到。因而本文选择其作为研究对象。
文章首先综述了在地图图符提取与识别方面国内外的发展状况,接着概要介绍了整个论文所涉及的算法。
彩色分割方面,在充分研究人眼视觉机理和色度学,模仿人眼感色机制的基础上,构造了一种把图像的空间分布和颜色空关有机结合的四维模型。
提出了基于四维模型的综合互补聚色算法。该算法对四维空间进行线性变换,对四类地形图要素构造不同的特征函数。针对彩色地形图印刷及扫描过程产生的颜色误差,该算法利用信息综合和逐层分解的方法,实现了地图不同要素之间的分版。大量测试表明该算法运行效率高、适应性强、自动化程度高。
等高线识别方面,提出了在等高线识别中先进行计曲线和首曲线分类的思想。即开始时采用模式识别通用的方法,分层识别,先粗分类,然后逐步细化处理,但在这一过程中保留其中的有用信息用来指导后续的处理与识别,这一新的思路 为进行等高线连接提供了重要的先验知识,明显地提高了等高线的断线连接率。
在等高线的断线连接中采用了多层混合法。该方法中各层采用金字塔结构,使人机智能达到最合理的分配。同时为等高线的断点建立一种动静结合的知识库,使程序的运行效率得到很大的提高。
给出了等高线组与等高线群的概念。在对等高线分版数据进行矢量数据压缩以及拓扑分析、高程赋值时,结合地形图知识设计了合理的数据结构。同时编制了基于二叉树的等高线高程自动赋值算法。该方法速度快,准确率高。
在点状图符识别方面采用了多基元信息融合和置信度分析的算法。该算法以多种特征作为识别的基础。它集成了两种神经网络分类器。利用各分类器输出数据中的置信度对最终结果进行综合判决。同时对识别置信度设置门限来进行流程控制,使总的系统在识别率不降低的情况下减少时间代价。
在汉字注记的分割方面,采用结构模式识别的有关理论同时结合基于知识的推理方法来构造识别框架,编制了对文字的结构和规则特性进行综合分析的算法。通过对搜索区域进行合理区分,使粘连汉字的分割取得了较明显的效果。
国防科学技术人学研究生院学位论文
综上所述,本文的工作在地形图图符自动提取与识别算法研究方面进行了有益的探
索,攻克了其中的一些理论和技术难题。为地形图计算机自动输入识别技术的工程应用
打下了良好的基础。
关键词等高线点状图符地图注记模式识别地形图汉字分割扫描数字化
!1