收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

场景文本识别关键技术研究

尹芳  
【摘要】:场景图像中包含着丰富的文本信息,它们可以从很大程度上帮助人们去捕获和认知场景图像的内容及含义,因此场景图像中的文本对其所在图像的视觉信息获取具有极其重要的作用。如果使用计算机自动识别场景图像中包含的文本内容,并应用于盲人辅助导航、无人驾驶导航、安全保卫、危机预防及处理等领域,将给人们的工作生活带来极大便利。 场景文本识别技术与传统的光学字符识别技术(Optical Character Recognition,OCR)有着显著差别,主要在于场景文本图像与传统扫描文档的不同。场景文本图像主要通过数码相机、摄像机等设备获得,图像中存在颜色不一致、亮度不均匀、背景复杂多变、噪声强烈等现象,文本可能发生变形、字迹模糊、残缺、笔划断裂等问题,这些干扰因素使得场景文本识别存在很大困难,面临诸多挑战。针对这些问题,本文拟对场景文本识别的几个关键技术展开研究,包括复杂背景下的文本提取技术;自然场景下的文本变形校正技术以及场景文本单字符识别技术。 针对场景文本背景图像构成复杂、影响文本识别效果的问题,通过分析场景文本图像的特点,在识别前进行预处理,将文本图像从复杂背景中提取出来,在此基础上提出了一种基于归一化割的谱聚类文本提取方法。首先根.据文本图像特点建立相似性权值函数,然后根据场景文本颜色分布特性按照颜色直方图对色彩空间进行量化,得到数量有限、不同颜色的像素集合,并以量化的颜色等级为单位结合像素的纹理特征及分布特点来构造相似矩阵,最后在归一化割准则下利用谱聚类方法实现图像分割。该方法将经过量化的颜色集合作为图分割中的顶点以简化加权图模型,从而显著降低谱聚类的计算复杂性,提高了谱聚类方法在图像分割方面的应用能力。在ICDAR2009、2003竞赛测试集、以及大量其他文本图像上的实验表明,本文方法具有良好的文本提取性能。 针对场景文本由于文本载体本身倾斜或获取过程中相机视角倾斜引起的倾斜变形和透视变形问题,提出了一种基于数学形态学的变形校正方法。使用形态学方法针对不同变形情况选取不同形态学因子提取特征点;然后通过聚类方法和最近邻方法根据特征点的聚类信息拟合文本基线,并使用随机采样一致性算法计算基线位置,获得变形参数;最后,通过投影变换完成文本图像的变形校正。实验结果表明,本文提出的方法能够对存在一定程度变形的场景文本进行校正,以提高文本识别系统的识别准确率,特别是对行数较少的场景文本的处理,与其他方法相比具有明显优势。 针对场景文本字迹模糊、笔划断裂、噪声强烈等问题,本文提出了一种鲁棒性强的提取Gabor小波特征的改进方法。该方法首先在基本Gabor小波变换基础上进行滤波方向的选择分类,然后利用带有方向选择性的小波变换提取Gabor特征,并与直方图相结合得到用于识别的组合特征。通过一系列的对比实验,显示出利用本文方法提出的组合特征针对笔划模糊这样的低质量字符图像具有良好的分类能力。 为寻求高性能的场景文本识别系统,本文提出了一种基于背景相关分析的文本识别方法。该方法针对场景中文本与其背景之间的相互联系,利用典型相关分析方法挖掘背景与文本之间的相关性,提取字符图像与背景图像之间的典型相关特征用作字符分类特征,在场景文本样本集上的测试取得令人满意的结果,实验数据显示使用典型相关特征显著提高了场景文本的识别性能,表明了该分类特征的有效性。该方法突破了传统识别方法仅考虑文本自身特征的局限性,充分利用了图像中文本的周边信息,对场景文本识别方法研究是一个新的突破。实验结果同时表明利用字符以外的背景信息辅助识别是一个值得继续研究的课题,它为实现高性能的场景文本识别系统提供了全新的研究思路。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈杰;孙忠贵;周书锋;;小波的文本图像区分及其在文献信息数字化中的应用[J];智能系统学报;2010年02期
2 黄治虎;;图像文本定位技术研究[J];计算机光盘软件与应用;2013年01期
3 谢凤英;姜志国;汪雷;;基于空白条方向拟合的复杂文本图像倾斜检测[J];计算机应用;2006年07期
4 侯跃云;刘立柱;;文本图像语种识别技术[J];计算机应用;2006年S1期
5 陆小川;伊兵哲;平西建;程娟;;含噪文本图像的中英文文种识别研究[J];计算机工程与设计;2007年21期
6 贺志明;;射影文本图像的校正[J];电气自动化;2008年01期
7 刘仁金;高远飙;郝祥根;;文本图像页面分割算法研究[J];中国科学技术大学学报;2010年05期
8 李晓昆;基于笔划识别的文本图像压缩[J];微型机与应用;1998年09期
9 曾凡锋;付亚南;;基于文字笔画结构的文本图像校正处理[J];无线互联科技;2014年02期
10 童莉,平西建;基于信息度量的图像特征与文本图像分类[J];计算机工程;2004年17期
11 贺志明;;数码相机拍摄的透视文本图像的校正[J];上海工程技术大学学报;2007年03期
12 肖人岳;秦慕婷;;一种复杂文本图像中快速文本行检测算法[J];科学技术与工程;2008年23期
13 曾凡锋;张国锋;陈侃;;中文文本图像倒置快速检测算法[J];计算机工程与设计;2012年09期
14 邱立松;黄继风;;文本图像信息的提取与识别[J];计算机与数字工程;2013年12期
15 王景中;朱其猛;;基于汉字笔画特征的文本图像倒置判断算法[J];计算机技术与发展;2014年05期
16 钟辉,曹爱国;文本图像汉字检索方法的研究[J];辽宁化工;2005年01期
17 杨洋;平西建;;复杂版面的文本图像图文分割算法[J];微计算机信息;2006年13期
18 谢椿;;文本图像认证的关键技术研究[J];科技风;2010年22期
19 钮燕;;一种新的视频文本定位方法[J];科技信息;2011年27期
20 曾东红;黄朝志;黄细妹;;基于底层图像特征组合的文本图像分类研究[J];江西理工大学学报;2013年05期
中国重要会议论文全文数据库 前1条
1 李兰兰;吴乐南;;一种带噪声文本图像的增强算法[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 章东平;视频文本的提取[D];浙江大学;2006年
2 戴祖旭;文本载体信息隐藏研究[D];华中科技大学;2007年
3 许剑峰;数字视频中的文本分割的研究[D];华南理工大学;2005年
4 谭利娜;文本图像鲁棒认证技术研究[D];湖南大学;2012年
5 王振;数字视频中文本的提取方法研究[D];中国海洋大学;2011年
6 黄晓冬;基于特征融合的视频文本获取研究[D];北京邮电大学;2010年
7 张昕;自然场景图像文本信息提取的理论与方法[D];清华大学;2014年
8 孙羽菲;低质量文本图像OCR技术的研究[D];中国科学院研究生院(计算技术研究所);2005年
9 刘丽;近重复文本图像匹配研究[D];华东师范大学;2014年
10 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 严智萍;基于字库修改的文本信息隐藏[D];湖南科技大学;2008年
2 杜敏;文本图像认证技术研究[D];西北大学;2010年
3 陆小川;印刷体文本图像的文种识别研究[D];解放军信息工程大学;2007年
4 黄细妹;基于决策树算法的文本图像分类方法研究[D];江西理工大学;2012年
5 陆兵;视频中的文本提取及其应用[D];河海大学;2007年
6 张磊;文本图像信息隐藏技术研究[D];解放军信息工程大学;2009年
7 王绪;文本图像处理与表格图像识别算法研究[D];解放军信息工程大学;2010年
8 郭龙;印刷体文本图像文种识别技术研究[D];解放军信息工程大学;2011年
9 陈侃;基于模糊计算的文本图像二值化方法研究与应用[D];北方工业大学;2010年
10 孟天;自然场景下的文本定位[D];西安电子科技大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978