收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

受限表格识别系统的研究

李艳霞  
【摘要】:表格识别是指利用计算机自动辨识印刷在纸或其他介质上的表格文档的过程。在学科上表格识别属于模式识别和人工智能的范畴,在应用上它是一种信息处理系统中高速自动输入方式,也是新一代计算机智能接口的一个重要组成部分。 近年来,表格的自动输入、存储、管理已经成为文档智能处理领域的一个重要组成部分。表格识别技术引起了众多学者的关注,成为OCR领域中的一个研究热点。一方面,表格结构复杂多样,使得很难找到一种能良好识别任何表格的通用方法;另一方面,很多领域使用的表格,如银行、邮局、税务等,需要识别的通常是固定的某些表格单元。综合这两方面因素,我们设计并实现了一个受限表格识别系统。 本文利用图像处理、模式识别等技术对受限表格识别问题进行了深入研究。目标是提高受限表格识别的正确率,以满足目前日益增长的智能表格处理的需求。详细地介绍了整个表格单元的提取过程:首先,生成表格结构描述文件,并具有灵活性和可扩展性的特点;然后,先对待识别表格进行倾角检测和校正,再根据描述文件局部检测表格线,准确定位表格单元;最后,对表格单元进行提取,这一步骤针对表格线与单元内字符有交叠的情况和单元内字符超出单元框线的情况,分别提出了基于距离加权的自适应字线分离算法,和分析连通域的方法,进行解决。保证了送入OCR识别之前的单元提取结果的正确性和完整性。同时,在每一步骤的设计上,进行了不同程度的算法优化,提高了系统的效率。实验结果表明,该系统流程对批量处理同类型表格取得了很好的效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 朱江,宣国荣;一种基于骨架特征顺序编码的脱机手写体数字识别方法[J];小型微型计算机系统;2001年08期
2 张伟,宣国荣;成绩单OCR录入系统中的自动校验[J];微型电脑应用;2000年07期
3 齐林,周艳霞,张晓静,魏世泽;OCR在油库考评系统中的应用[J];河北科技大学学报;2001年03期
4 覃胜 ,刘晓明;基于图像的OMR技术的实现[J];电子技术应用;2003年10期
5 邢立民;陈永琴;;扫描仪的OCR技术[J];实验室科学;2006年06期
6 张成昱,赵仪,邹荣,曾婷;中文电子图书系统开发和应用研究[J];大学图书馆学报;2002年04期
7 叶俊勇,杨波,彭健,吕永平,汪同庆;路桥收费计算机监控管理系统[J];计算机应用;2002年03期
8 刘建胜,汪同庆,王贵新,居琰;基于DSP的版面分析和OCR识别的原理及实现[J];仪器仪表学报;2003年06期
9 薛炳如,杨静宇,娄震,胡钟山;小类别数手写汉字建模[J];中文信息学报;1999年06期
10 李佐,王姝华,蔡士杰;一种新的字符特征提取方法及其在识别中的两个应用[J];南京大学学报(自然科学版);2002年01期
11 迟春佳;;OCR技术及其在高校图书馆信息资源数字化建设中的应用[J];中国科技信息;2007年07期
12 李红霞;;浅析题库建设中扫描仪及OCR软件的使用方法与技巧[J];科技信息;2010年24期
13 黄磊,刘昌平;信函自动分拣软件系统[J];计算机工程与应用;2003年19期
14 朱宁波,娄震,杨静宇;支票大写金额的印刷体与手写体辨识[J];计算机工程;2003年09期
15 管聪慧,宣国荣;一种对表单型OCR系统的性能评价方法[J];小型微型计算机系统;2003年08期
16 徐军,卢碧红;文件修正系统的设计与实现[J];计算机工程与设计;2003年06期
17 杨波,叶俊勇,彭健,汪同庆;高校网上录取数据录入管理系统的开发[J];重庆大学学报(自然科学版);2000年06期
18 陈晓雯;计算机稽核管理信息系统的组建[J];山西电子技术;2003年03期
19 陈艳,孙羽菲,张玉志;灰度图像中字符切分方法的研究[J];中文信息学报;2004年04期
20 王贵新,刘劲胜,居琰,何天文;OCR和OMR同时存在的表格数据识别编程[J];电脑开发与应用;2000年10期
中国重要会议论文全文数据库 前9条
1 王景中;霍超;;基于OCR技术的盲用阅读器设计[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
2 范杰清;孙凤杰;李宝儒;;OCR技术在高压断路器开关图像识别中的应用[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
3 梁莹;施善旦;;海蓝目录自动识别系统的设计[A];广西计算机学会2004年学术年会论文集[C];2004年
4 谭怒涛;刘昌平;黄磊;;中英文文档中公式定位[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
5 胡溪;;DICOM打印服务在放射科的应用[A];2010中华医学会影像技术分会第十八次全国学术大会论文集[C];2010年
6 ;A new algorithm for text segmentation based on stroke filter[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
7 马志超;张小静;宋洪涛;;氙灯日光模拟器下有机防晒剂在乳膏中的光降解研究[A];2011年中国药学大会暨第11届中国药师周论文集[C];2011年
8 梁莹;肖健;李玥;;多引擎印刷体汉字识别系统研发[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
9 臧元奇;田相利;董双林;董云伟;;仿刺参排脏及内脏再生过程中生长、代谢及免疫应答[A];渔业科技创新与发展方式转变——2011年中国水产学会学术年会论文摘要集[C];2011年
中国博士学位论文全文数据库 前6条
1 马玉涛;在线客户评论的产品族设计与加工方法研究[D];华中科技大学;2012年
2 张艳;票据自动处理系统中若干关键技术研究[D];南京理工大学;2008年
3 程艳芬;离线阿拉伯手写体光学文字识别方法的研究[D];武汉理工大学;2009年
4 丁杰;无限制手写体数字串切分与识别的相关问题研究[D];南京理工大学;2010年
5 田大增;视觉文档图像识别预处理[D];河北大学;2007年
6 汪炜;卢梭与Narcisse问题[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 李艳霞;受限表格识别系统的研究[D];中国科学院研究生院(计算技术研究所);2006年
2 霍超;嵌入式OCR系统的研究[D];北方工业大学;2010年
3 田晓光;航空气象地图的分层化OCR系统及其若干关键技术的研究[D];电子科技大学;2010年
4 郭军;信息资源数字化文本型数字图像OCR识别准确度影响因素及提高策略研究[D];郑州大学;2011年
5 郇政永;基于OCR的中文文本校对研究[D];北方工业大学;2011年
6 陈波;基于OCR技术的飞机定检数据收集系统设计[D];电子科技大学;2010年
7 王文姣;OCR图像采集参数自动选择的研究[D];河北大学;2009年
8 李宏峰;基于OCR的试卷版面理解[D];安徽工业大学;2012年
9 林强;基于OCR的支票识别系统的研究与实现[D];北京邮电大学;2010年
10 瞿海金;手写体数字识别方法的研究与实现[D];南京理工大学;2005年
中国重要报纸全文数据库 前10条
1 刘津;OCR,苹果熟了[N];北京科技报;2002年
2 马庆仁;扫描仪水涨OCR船高[N];中国企业报;2000年
3 肖苇;OCR最后的一张骨牌[N];中国质量报;2002年
4 本报记者 季捷;扫描仪价格狂降OCR夺路而逃[N];计算机世界;2002年
5 ;OCR产业慢启动完成快增长来临?[N];中国高新技术产业导报;2002年
6 利乐;利乐启动OCR计划与客户合作共赢[N];中国包装报;2010年
7 刘雨;依托解决方案 拓展OCR渠道[N];中国计算机报;2002年
8 李政楠;OCR技展沈阳国税[N];中国计算机报;2000年
9 李晓力;清华文通领先科技[N];中国高新技术产业导报;2000年
10 本报记者 陈昌成;OCR产业:慢启动完成快增长来临[N];中国企业报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978