收藏本站
《河北大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

视觉文档图像识别预处理

田大增  
【摘要】: 由于数码相机等数字成像设备的焦距、曝光选择,以及被拍摄文档存在折痕、污渍和角度变形的原因,从而使得拍摄出的视觉文档图像产生噪声、整体明暗不均、扭曲变形等情况,这些现象轻则影响到OCR系统文字的识别率,重则无法识别。针对视觉文档图像中出现的上述问题,本文给出了噪声去除、光学校正以及几何校正等预处理方法,改善了视觉文档图像的质量,提高了文档图像光学字符的识别率。主要工作如下: 1、针对视觉文档图像在获取、处理、传输中产生的椒盐噪声,提出一种基于文字笔画特性的消除椒盐噪声的算法。该算法通过判断被处理像素及其邻域像素点是否为噪声,从而有效地将文字目标和椒盐噪声加以区分。实验结果显示,相比传统的去噪和平滑算法,该方法能准确地抑制噪声,同时避免了对文字笔画的影响,减少了对后继识别的干扰。 2、针对视觉文档图像存在的反渗噪声,本文根据其不同的直方图特征,分别提出处理方法。对于灰度直方图呈双峰特性的含反渗噪声的视觉文档图像,反渗印迹的灰度值与正面字迹的灰度值相差较大,可将像素值分为三个不同的区间,分别进行处理,对于中间的区间进行增强处理,而对于其余两个区间进行归一化处理,从而能够有效地去除反渗噪声;对于直方图呈现单峰特性的反渗噪声,提出一种基于背景分离的去除反渗噪声方法,经实验验证,该算法可以有效去除单峰图像的反渗噪声。 3、针对具有折痕噪声的视觉文档图像,提出目标增强的处理方法,解决了折痕在识别时造成的问题,提高了OCR的识别率。 4、对于模糊的文档图像,提出一种寻找文字骨架的方法,该方法能够有效地消除图像的模糊。 5、对于曝光不良视觉文档图像,分两种情况进行讨论: (1)针对曝光不足的视觉文档图像所存在的问题,提出一种视觉文档图像目标增强算法,将文字图像中的目标和背景加以区分,并对图像背景进行归一化,对图像目标部分进行增强处理。实验结果显示,该方法可以有效地处理曝光不足的低对比度视觉文档图像,提高OCR识别率。 (2)对于曝光过度的视觉文档图像而言,提出使用双侧增强来进行处理的方法。 6、对于边缘模糊的视觉文档图像,利用小波变换将图像进行分解,根据需要对不同位置、不同方向上的某些小波分量通过扩大或缩小其系数,从而使得某些感兴趣的分量放大而使某些不需要的分量减小,使得图像得到增强,提高文字识别率。 7、针对圈边文字图像,利用基于邻域跟踪的边框去除方法,有效地去除圈边及长线段。 8、对于由积厚文档造成的视觉文档图像扭曲变形,利用单向伸展的几何校正方法,实现了文字行的扩大,进而分析了分栏图像的特点,并采用分段拟合校正图像的方法,提高了OCR识别率。
【学位授予单位】:河北大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP391.41

【引证文献】
中国期刊全文数据库 前1条
1 朱颖婷;周良;;基于字符编码和图像分块的文档完整性检测方法[J];中国制造业信息化;2012年03期
中国博士学位论文全文数据库 前1条
1 赵健;小波与分形理论在图像处理中的应用研究[D];西北工业大学;2003年
中国硕士学位论文全文数据库 前9条
1 张艳;图像拼接技术在文档图像扭曲识别中的应用与研究[D];北方工业大学;2011年
2 陈新春;数据表格自动识别系统[D];吉林大学;2011年
3 祁晓锐;扫描文档图像纠偏技术应用研究[D];山东大学;2011年
4 覃南鑫;基于OpenCV的人脸识别系统的研究与实现[D];武汉纺织大学;2012年
5 曹珩;基于数学形态学的医学图像边缘检测算法研究[D];武汉工程大学;2011年
6 周双飞;基于大字符集脱机手写体汉字识别方法研究[D];苏州大学;2011年
7 张望博;基于支撑笔画的视觉文档图像透视失真校正[D];河北大学;2009年
8 王旭阳;激光微调技术在调节传感器感应距离上的研究和应用[D];上海交通大学;2013年
9 张扬;基于Tesseract光学字符辨识应用的设计与实现[D];西安电子科技大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 赵楠楠,欧阳鑫玉,吴庆洪;线性回归与Hough变换在计算图像倾斜角度中的应用[J];鞍山科技大学学报;2003年06期
2 刘健康;齐国清;姜国兴;;一种适合于图像细节保留的椒盐噪声滤波器[J];大连海事大学学报;2006年01期
3 杨顺辽;;基于Hough变换提取直线的改进方法研究[J];电脑与信息技术;2006年05期
4 丁晓青,郭繁夏;中文OCR技术最新进展[J];电子出版;1995年12期
5 丁晓青,郭繁夏;中文OCR技术最新进展(续)[J];电子出版;1996年01期
6 李昆仑,黄厚宽,田盛丰;模糊多类SVM模型[J];电子学报;2004年05期
7 杨群生,黄继武,康显桂;直方图加权均值滤波器[J];电子学报;2004年07期
8 王保平,范九伦,谢维信,刘升虎;基于直方图的自适应图像去噪滤波器[J];电子学报;2004年07期
9 江巨浪;张佑生;薛峰;胡敏;;保持图像亮度的局部直方图均衡算法[J];电子学报;2006年05期
10 王萍霞;把数码照片上的文字OCR出来[J];电子世界;2004年10期
中国博士学位论文全文数据库 前1条
1 赵健;小波与分形理论在图像处理中的应用研究[D];西北工业大学;2003年
中国硕士学位论文全文数据库 前1条
1 姚园;数字化信息卡文档图像预处理系统的设计与核心算法[D];华中科技大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 陈学锋;瞿金平;;注塑机曲肘式合模机构弹性振动的研究[J];工程塑料应用;2008年03期
2 陈文元;李雪梅;迟晓梅;;小波分析与神经网络在结构多处损伤监测中的应用[J];四川建筑科学研究;2006年03期
3 王全凤;郑浩;;基于径向基函数神经网络的高层建筑结构选型[J];四川建筑科学研究;2010年05期
4 谢晓娣;基于小波包变换的地铁远方短路电流分析[J];安徽电气工程职业技术学院学报;2005年01期
5 裴莉;傅庆;刘华军;;电力系统图像识别技术的研究和应用[J];安徽电气工程职业技术学院学报;2011年S1期
6 刘治群;杨万挺;朱强;;几种图像增强算法的研究比较[J];合肥师范学院学报;2010年06期
7 张大明;樊晓香;刘华勇;李璐;;信息与计算科学专业“数字图像处理”课程教学探索与实践[J];合肥师范学院学报;2012年03期
8 蒲东兵;马志强;庞长明;孙英娟;于哲舟;;基于DSP的掌纹识别门禁系统设计与实现[J];安防科技;2008年02期
9 汤自安;刘晓波;汪虽富;吕乃杰;;基于音视频矩阵的生产调度会议系统应用[J];安防科技;2009年04期
10 黄加翼;乔梁;;高能X射线包裹图像边沿特征识别方法[J];安防科技;2011年03期
中国重要会议论文全文数据库 前10条
1 裴莉;傅庆;刘华军;;电力系统图像识别技术的研究和应用[A];2011年安徽省智能电网技术论坛论文集[C];2011年
2 杨洁;王朝辉;;遥感监测中变化信息提取的方法探讨[A];江苏省测绘学会2011年学术年会论文集[C];2011年
3 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
5 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
6 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
7 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
8 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
9 梁禹;王义刚;王娜;;基于支持向量机的电力电子电路故障诊断[A];第二十六届中国控制会议论文集[C];2007年
10 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 朱广平;混响干扰中的信号检测技术研究[D];哈尔滨工程大学;2009年
7 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
8 王咏胜;复数轮廓波变换的构造、扩展及其图像处理应用[D];哈尔滨工程大学;2009年
9 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
10 许志远;雾天降质图像增强方法研究及DSP实现[D];大连海事大学;2010年
中国硕士学位论文全文数据库 前10条
1 展慧;基于多源信息融合技术的板栗分级检测方法研究[D];华中农业大学;2010年
2 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
3 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
4 刘甲玉;基于ARM的图像采集与无线传输技术的研究[D];安徽工程大学;2010年
5 何慧娟;基于多传感器的移动机器人障碍物检测与定位研究[D];安徽工程大学;2010年
6 田继辉;用于三维影像快速浏览的多尺度DEM数据组织研究[D];河南理工大学;2010年
7 代宏伟;布里渊散射水下探测目标的自动识别[D];南昌航空大学;2010年
8 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
9 黄正荣;基于振动波的高速公路车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
10 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 翟中生,程宪平;肿瘤细胞辅助诊断系统的研究[J];传感器技术;2005年02期
2 田娅,饶妮妮,蒲立新;国内医学图像处理技术的最新动态[J];电子科技大学学报;2002年05期
3 曹俊杰,封靖波,苏志勋;全景图像拼接算法[J];大连理工大学学报;2003年S1期
4 张仕成;;基于Google Android平台的应用程序开发与研究[J];电脑知识与技术;2009年28期
5 周德华,毛敏峰,徐浩;一种多人脸跟踪算法的研究与实现[J];电视技术;2005年05期
6 丁晓青,郭繁夏;中文OCR技术最新进展[J];电子出版;1995年12期
7 丁晓青;汉字识别研究的回顾[J];电子学报;2002年09期
8 蔺志青,郭军;贝叶斯分类器在手写汉字识别中的应用[J];电子学报;2002年12期
9 解凯,郭恒业,张田文;图像Mosaics技术综述[J];电子学报;2004年04期
10 赵继印;郑蕊蕊;吴宝春;李敏;;脱机手写体汉字识别综述[J];电子学报;2010年02期
中国博士学位论文全文数据库 前2条
1 赵于前;基于数学形态学的医学图像处理理论与方法研究[D];中南大学;2006年
2 赵现明;XBRL财务报告标准研究:市场反应及标准扩散[D];上海交通大学;2010年
中国硕士学位论文全文数据库 前10条
1 王青伟;激光调阻机运动控制系统设计与研究[D];长春理工大学;2002年
2 安艳辉;中英文混排字符切分方法研究[D];河北大学;2004年
3 董璐;数字图像处理与识别系统的开发[D];东南大学;2004年
4 王咏胜;基于数学形态学的灰度图像的边缘检测技术研究[D];哈尔滨工程大学;2005年
5 周锦煌;图像处理与识别在牙X线影像中的应用[D];暨南大学;2005年
6 丁凰;表单图像版面分析方法研究[D];西安电子科技大学;2006年
7 梁涌;印刷体汉字识别系统的研究与实现[D];西北工业大学;2006年
8 董五洲;基于统计分类的混排字符切分算法的研究[D];燕山大学;2006年
9 邓楠;基于主成分分析的人脸识别研究[D];西北大学;2006年
10 郜丽丽;表单文件的识别与理解[D];山东大学;2006年
【二级引证文献】
中国硕士学位论文全文数据库 前3条
1 蒋海波;扫描图像的倾斜校正、分割与压缩[D];山东大学;2012年
2 潘保安;3D数字相机结构及测量系统的设计与研发[D];南京理工大学;2013年
3 郭晓芳;基于小波变换的网上阅卷图像倾斜校正方法[D];郑州大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 王祖林,周荫清;多重分形谱及其计算[J];北京航空航天大学学报;2000年03期
2 燕英,周荫清,李春升,陈杰;星载SAR图像斑点抑制与质量评估系统[J];北京航空航天大学学报;2001年05期
3 袁超伟,王桃荣;基于第二代小波变换的多分辨率图像水印方案[J];北京邮电大学学报;2002年03期
4 杨文杰,刘浩学;JJ数字图像处理系统的研制[J];北京印刷学院学报;2002年02期
5 黄文骞;数字地图符号的形状描述与识别[J];测绘学报;1999年03期
6 陈文周,韩明华;多媒体数据压缩技术研究(连载Ⅱ)[J];电视技术;2000年06期
7 覃胜 ,刘晓明;基于图像的OMR技术的实现[J];电子技术应用;2003年10期
8 焦李成,保铮;子波理论与应用:进展与展望[J];电子学报;1993年07期
9 张亮;郭桂蓉;庄钊文;何松华;马莉波;;雷达目标高分辨距离像数据预处理方法研究[J];电子学报;1998年06期
10 黄继武,YunQ.SHI,程卫东;DCT域图像水印:嵌入对策和算法[J];电子学报;2000年04期
【相似文献】
中国期刊全文数据库 前10条
1 孙楠;刘志文;;一种改进的中文文档图像倾斜检测方法[J];计算机仿真;2006年09期
2 赵飞;谢里阳;李佳;;最大投影栅缝法检测文档图像倾斜角[J];计算机应用;2011年06期
3 赵健,田泽,李镐炜,周明全;基于小波的文档图像分割改进算法[J];小型微型计算机系统;2004年10期
4 钟辉,姜小帅,刘辉;文档图像汉字检索方法[J];沈阳建筑大学学报(自然科学版);2005年04期
5 刘婀娜;刘一斐;祁建芳;;基于三维边缘重构的文档图像自动矫正方法[J];计算机应用研究;2007年07期
6 魏宏喜;高光来;;蒙文文档图像的倾斜检测方法[J];内蒙古大学学报(自然科学版);2007年04期
7 张田;王希常;尘昌华;;基于特征的文档图像检索[J];计算机工程;2009年22期
8 尚新萍;吴燕玲;;提高影像文档图像质量的预处理研究[J];科技信息;2009年31期
9 宋涛;刘刚;;一种基于内容的文档图像检索方法[J];郑州大学学报(工学版);2010年01期
10 张田;;一种改进的文档图像倾斜检测算法[J];西华大学学报(自然科学版);2010年01期
中国重要会议论文全文数据库 前4条
1 钟辉;黄洋;;基于版面特征的文档图像的文本定位方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
2 国伟;刘宇鑫;宗泽;亓文法;;印刷纸介质文档图像中的信息隐藏技术研究[A];颜色科学与技术——2012第二届中国印刷与包装学术会议论文摘要集[C];2012年
3 付旻;高芸;黄祥林;;文档图像分割技术研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
4 靳从;;规则文档图像噪声处理方法[A];首届信息获取与处理学术会议论文集[C];2003年
中国重要报纸全文数据库 前1条
1 程光;成像技术走向邮政[N];人民邮电;2002年
中国博士学位论文全文数据库 前3条
1 田大增;视觉文档图像识别预处理[D];河北大学;2007年
2 刘建胜;文档图象版面理解的研究[D];重庆大学;2002年
3 张志伟;数学表达式数字化处理中关键技术的研究[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 张田;基于特征的文档图像检索[D];山东师范大学;2009年
2 姚园;数字化信息卡文档图像预处理系统的设计与核心算法[D];华中科技大学;2004年
3 彭涛;海量文档图像信息的自动提取相关技术研究与实现[D];华中科技大学;2006年
4 赵聪;多镜头文档图像拼接技术研究[D];中南大学;2012年
5 吴军;扫描文档图像的处理方法的研究和应用[D];山东师范大学;2015年
6 杨晓娟;数字图书馆—文档图像的检索[D];沈阳理工大学;2009年
7 郝永;视觉文档图像光学失真的校正[D];河北大学;2008年
8 张艳;图像拼接技术在文档图像扭曲识别中的应用与研究[D];北方工业大学;2011年
9 高鸿;文档图像拼接技术研究[D];中南大学;2011年
10 林杰;文档图像的层分割研究[D];重庆大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026