收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

复杂图像文本提取关键技术与应用研究

张健  
【摘要】:近年来,随着便携式摄影设备的普及和互联网发展,数字图像和数字视频的数量正以惊人的速度增长。嵌入在图像和视频中的文字是图像语义的重要表达方式。如果能够利用计算机自动定位和识别这些文字,就可以让计算机自动理解图像的内容,进而借助已经成熟的文本检索技术来检索图像,从而为基于内容的图像和视频处理提供一种途径。 国内外学者在复杂图像文本提取与识别方面做了大量研究,并取得阶段性成果,现有OCR软件处理文档图像取得了很好的效果。但是对背景较为复杂的场景图像和分辨率较低的原生数字图像中包含文本的提取研究还处于初级阶段。 本文中,我们将复杂图像文本提取过程分为如下四个步骤:图像二值化处理;在二值化图像中提取所有连通体;通过条件随机场模型标记文本连通体;对文本连通体进行文字识别。针对提取过程的每一个步骤,本文进行了如下研究: 首先,利用小波的优良去噪性,提出了基于小波变换的图像二值化方法。先将待处理复杂图像转化为灰度图像,然后利用小波分解、多层小波滤波、小波重构将图像中的前景文字作为噪音去除,从而得到图像的背景分布;将背景分布与灰度图像做差运算得到图像的前景分布;再计算局部阈值;最终得到二值化图像。通过与其他著名的八种二值化方法进行对比实验,表明基于小波变换的二值化方法优于其它方法。 第二,采用深度遍历方法和形态学的膨胀操作对二值化图像进行连通体抽取,选取连通体关键特征,基于条件随机场模型进行文本分割。选取合理的实验参数,CRF模型能够很好地对连通体进行分类,达到文本分割的目的。 第三,使用改进的HOG特征对文字进行识别。考虑在倾斜、光照不均、噪音干扰、边缘柔化等多种异态情况下的复杂图像的字符识别问题,提出基于稀疏编码与梯度方向直方图相结合的SC-HOG方法来进行字符识别研究。此方法先利用稀疏编码得到基向量和稀疏系数,通过重构图像滤除噪音、处理边缘柔化;然后利用梯度方向直方图抽取复原图像的字符边缘梯度特征,削弱倾斜和光照的影响;最后将获取的特征向量送入分类器,实现异态字符的识别。通过在设计字符集和现实字符集上进行字符识别实验表明,SC-HOG方法能够对上述复杂情况的图像中包含的文本进行有效的识别。 第四,考虑字符图像尺度和平移影响文字识别率的问题,提出了具有尺度和平移鲁棒性的STRHOG方法来进行字符识别。通过剪裁梯度矩阵处理将字符图像的“边”去除,通过归一化梯度矩阵处理,将待识别的字符图像转换为相同大小,实验表明,利用STRHOG方法处理的图像,文字识别率得到了很大提高。 最后,文中对复杂图像文本提取技术做了应用研究,指出了该技术广阔的应用前景。并且利用本文提出的关键技术,构建基于关键词的敏感网络图像过滤系统。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 谭璐,吴翊,刘卓;高维图像数据的最优表达[J];国防科技大学学报;2003年05期
2 张辉;胡广书;;基于二维卷积的图像插值实时硬件实现[J];清华大学学报(自然科学版);2007年06期
3 李锌;张飞舟;;基于再生核滤波器的边缘保护图像插值方法[J];计算机工程与应用;2008年13期
4 詹毅;;自适应图像插值改进算法[J];计算机工程;2010年16期
5 张峥嵘;刘红毅;韦志辉;;边缘保持的核回归图像插值方法[J];计算机工程;2011年19期
6 邵宇;刘莹;孙富春;;张量值图像插值方法综述[J];中国图象图形学报;2012年10期
7 刁茜;邝悦;董道国;;一种近似图像插帧的快速算法[J];计算机应用与软件;2012年11期
8 李将云,杨勋年,汪国昭;分割图像插值的一种局部算法[J];浙江大学学报(理学版);2002年01期
9 黄海赟,戚飞虎,陈剑,姚志洪;基于小波的医学图像插值[J];自动化学报;2002年05期
10 郑胜,田金文,柳健;二乘向量机在图像插值技术中的应用研究[J];计算机工程与应用;2004年17期
11 肖义男,文玉梅,罗毅;图像插值模糊的非线性自适应消除[J];计算机应用;2005年10期
12 程村;基于曲线曲面演化的图像插值方法[J];工程地球物理学报;2005年01期
13 詹毅;王明辉;李梦;;梯度角约束图像插值[J];计算机辅助设计与图形学学报;2009年06期
14 王孝通;金鑫;徐晓刚;张美玉;;联合双边图像插值[J];中国图象图形学报;2011年12期
15 詹毅;;基于泰勒展开式的图像插值方法[J];计算机工程;2012年13期
16 李保洲,邓雁萍,李介谷;基于代数约束的图像生成[J];上海交通大学学报;2000年05期
17 周小四,王淑华,李晓翔;基于代数约束的图像生成方法研究[J];计算机工程;2002年06期
18 肖义男,文玉梅,罗毅;基于边缘敏感滤波的图像插值模糊消除[J];仪器仪表学报;2004年S2期
19 鲁志波;胡国恩;;基于结构张量的图像插值方法[J];计算机应用;2006年07期
20 韩维维;解保华;;基于统计特征的医学图像插值[J];现代计算机;2006年08期
中国重要会议论文全文数据库 前4条
1 胡巍;张桂林;陈朝阳;;基于正交函数积分理论的图像插值方法[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
2 姚春莲;高丽华;陈谊;李炜;;基于图像插值的帧内预测[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
3 肖义男;文玉梅;罗毅;;基于边缘敏感滤波的图像插值模糊消除[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
4 仵冀颖;阮秋琦;;偏微分方程约束的非局部均值图像插值模型[A];第十三届全国图象图形学学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 魏平;数字乳腺钼靶图像的软拷贝显示技术研究[D];浙江大学;2009年
2 Rukundo Olivier;灰度图像插值优化方法的研究[D];华中科技大学;2012年
3 刘芳;图像可逆信息隐藏技术若干问题研究[D];大连理工大学;2013年
4 刘哲星;医学图像回溯性配准研究[D];第一军医大学;2002年
5 付晓薇;基于量子力学的图像处理方法研究[D];华中科技大学;2010年
6 张健;复杂图像文本提取关键技术与应用研究[D];南开大学;2014年
7 冯宇平;图像快速配准与自动拼接技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2010年
8 魏昱;图像显著性区域检测方法及应用研究[D];山东大学;2012年
9 王捷;基于相位信息的TCMR图像心肌运动估计方法研究[D];华中科技大学;2014年
10 李战委;基于神经网络的虚拟场景真实感图像重建[D];天津大学;2003年
中国硕士学位论文全文数据库 前10条
1 宁丽华;基于图像插值的集群系统在视频中的应用研究[D];电子科技大学;2008年
2 高月芳;图像的变形及三维重建技术研究[D];合肥工业大学;2003年
3 高欣玮;基于压缩视频的图像插值技术研究[D];哈尔滨工业大学;2011年
4 张健;图像插值及帧率提升算法研究[D];哈尔滨工业大学;2009年
5 罗立彦;图像插值与离散曲面去噪[D];浙江大学;2006年
6 牛艳霞;基于曲率驱动的图像修补方法[D];郑州大学;2007年
7 吕微微;基于情感的图像分类算法研究与实现[D];北京交通大学;2012年
8 刘俊华;数字图像插值[D];兰州大学;2010年
9 杨晓莉;基于暗通道先验的图像去雾改进算法[D];南京邮电大学;2014年
10 岳义振;基于点采样和边缘特征的图像插值方法[D];山东大学;2010年
中国重要报纸全文数据库 前1条
1 ;爱国者自然窗330T[N];中国计算机报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978