收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

表格识别预处理技术与表格字符提取算法的研究

谢亮  
【摘要】:OCR 是模式识别中最热门的研究领域之一,而表格识别是OCR 的一个重要的研究和应用方向。本文主要讨论表格识别中的两个问题,即表格识别预处理技术与表格字符提取算法。 二值化是图像处理和字符识别中相当重要的一个环节。本文在现有的图像二值化算法的基础上,针对手写表格文档提出了一种基于非线性对比度增强及LoG算子的混合二值化方法,基本上克服了现有方法所存在的对噪声敏感、速度较慢、易导致笔划断裂等缺点。实验证明该方法比传统方法有显著改进。 待识别文档被扫描成图像的过程中不可避免地会出现一定的倾斜。本文针对表格文档图像,在Hough 变换的基础上提出了一种带参数约束条件的Hough 变换——HTPC,有效降低了传统Hough 变换的计算复杂度,并结合一种快速图像旋转方法,实现了对表格文档图像的快速倾斜角检测及校正。 本文研究的重点之一是如何解决表格文档中手写字符经常重叠表格边框线的问题。为此,我们提出了一种新方法来准确定位和完整地提取重叠边框线的字符,即先通过CTF 过程准确地定位并提取出表格的所有单元格,再通过ECCEA方法完整地提取出表格中的字符,然后利用基于连通区域检测的去噪算法对图像进行去噪,最后对字符图像进行平滑化处理。实验表明了我们的方法的有效性。 最后,我们利用本文提出的表格文档预处理及字符提取算法,并结合我们对字符分割、特征提取以及分类器设计等问题的最新研究,研制开发了Windows平台上适用的《成绩单自动识别系统》,其总体识别率平均达到了90.89%。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘云飞;李丽娟;;一种基于字符边界的细化算法[J];科学技术与工程;2006年10期
2 黄文杰;;基于投影的车牌字符分割方法[J];现代计算机(专业版);2009年08期
3 王江晴;万晨;;周边方向贡献度在脱机手写女书特征提取中的应用[J];中南民族大学学报(自然科学版);2010年03期
4 刘碧梧,王慧娟;排版软件CCT[J];编辑学报;1997年01期
5 曾东武,刘重庆,陶世焰;Fourier 描述符的印鉴识别方法[J];上海交通大学学报;1998年09期
6 李跃辉;;一种基于改进型存储结构OSD芯片的设计与实现[J];中国集成电路;2009年08期
7 沈整;中文字模的边界检测及算法研究[J];长沙电力学院学报(自然科学版);1997年04期
8 靳简明,丁晓青,彭良瑞,王华;印刷维吾尔文本切割[J];中文信息学报;2005年05期
9 余棉水,黎绍发,陈智斌;车牌自动识别技术的研究[J];机电工程技术;2003年01期
10 王玉雷;李永忠;王汝山;;粗网格在印刷体藏文特征提取中的应用[J];科学技术与工程;2009年18期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 王四平;朱薇薇;刘志文;;一种新的斜体印刷字倾斜角度检测算法[A];全国第一届信号处理学术会议暨中国高科技产业化研究会信号处理分会筹备工作委员会第三次工作会议专刊[C];2007年
中国博士学位论文全文数据库 前2条
1 陈为;基于变化方向光源的压印立体字符分割方法的研究[D];山东大学;2013年
2 郭承青;抗打印扫描数字水印技术及其应用研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 常永鑫;机刻字符自动识别技术的研究[D];重庆大学;2010年
2 陈群;关于提高视频测速精度的研究[D];浙江工业大学;2013年
3 朱曼瑜;激光雕刻金属雷管编码字符识别方法及应用研究[D];华中科技大学;2013年
4 陈衍平;基于视频图像处理的交通检测算法及应用研究[D];江西理工大学;2011年
5 虞飞;机打普通商业发票识别系统研究[D];华南理工大学;2013年
6 金灿;纸币号码识别方法研究[D];沈阳工业大学;2013年
7 王永春;自动车牌识别关键技术研究[D];中南大学;2013年
8 高星;汽车牌照自动识别方法的研究[D];大连理工大学;2011年
9 陈晨;智能交通系统中车牌识别的关键技术研究[D];南京理工大学;2014年
10 徐剑峰;电能表表号点状数字识别算法研究[D];沈阳航空工业学院;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978