收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

复杂背景图像的文本信息提取研究

孙巧榆  
【摘要】:图像中的文本包含大量有价值的信息,是智能控制系统和信息检测与检索系统的重要处理对象。手机及各种便捷式图像获取设备的普及使得越来越多的信息载体以图像或视频的形式存在,让计算机代替人来处理、识别和理解图像中所包含的文字信息有强烈的应用需求,然而计算机对图像文本信息的识别和理解能力与实际应用要求尚有不小的距离。图像中文本信息的有效提取一直受到研究者的关注,尤其是复杂背景中的文本信息提取技术依然是急需解决的技术难题。 本文研究工作着眼于对手机和相机等便携设备拍摄的具有复杂背景的图像中检测和定位文本信息,通过分析复杂背景图像中文本的固有特性,研究了三种文本检测和定位算法,实现了一个文本信息提取与识别系统。本文的主要研究成果和贡献包括: (1)提出了一种基于纹理和统计特征的文本检测和定位方法。采用简化的均值偏移方法对图像进行平滑滤波,对图像进行去噪的同时能保留变化相对较强的细节信息:在边缘图像中根据文本的纹理特性构建像素的笔划特征,去除非文本像素;利用文本的统计特征,去除非文本区域块。实验表明,该算法具有较快的速度和较高的召回率,尤其对处于复杂背景或与背景粘连的文本比较有效。 (2)提出了一种基于改进的视觉关注模型的文本检测和定位方法。对Itti视觉关注模型进行了改进,一是高斯金字塔的层数可以根据图像的大小自动调整;二是根据字符的特性选择强度特征图作为显著图,去掉可能弱化文本区域的归一化过程;三是为了突出显著图中的细节信息,获取显著图的时候对特征图进行上采样,得到与源图像尺寸相同的显著图。利用字符边缘点的方向分布呈对称性的特点对连通元做初步过滤后,采用显著图作为掩膜来验证候选文本区域的真伪。实验表明,该算法具有较好的检测性能,能够有效地检测出对比度较弱的文本区域。 (3)提出了一种基于尺度空间的文本检测和定位的方法。改进了边缘检测的模板,将4个方向的Sobel算子模板中两个对角线方向的模板替换为对应方向的脊线算子模板,以改善文本和背景粘连的处理效果。利用尺度空间中拉普拉斯-高斯算子最大响应值的特性来滤除非文本块,该响应值在尺度上往往和字符的笔划宽度对应,并且分布在笔划的交界和末端,利用候选文本区域的笔划宽度作为启发条件,寻找尺度空间中是否有对应的较强响应点存在,结合这些点的分布情况滤除非文本区域。实验结果表明该算法具有较高的精确度。 (4)实现了一个自然场景图像中的文本自动检测与识别系统。对于输入的自然场景图像首先利用文本检测和定位方法给出图像中的文本区域,然后对检测出的文本区域在二值化后进行尺度归一化处理,最后利用一个字符识别软件提取出文本区域中的文字信息。 (5)对三种文本检测和定位方法的性能做了比较和分析,并实验表明每种方法各有优缺点,基于纹理和统计特征的文本检测和定位方法的整体性能指标虽然低于其余两种方法,但该方法对于复杂文本背景的图像比较有效;基于视觉关注模型的文本检测和定位方法的性能稍逊于基于尺度空间的文本检测和定位的方法,但该方法能够成功检测出对比度较弱的文本区域;基于尺度空间的文本检测和定位方法的整体性能指标最高,尤其是在精确度上具有优势,能够有效去除和文本类似的背景区域。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 黄同城;丁友东;;基于高频小波系数分类器的图像文本信息的非监督检测[J];湖南农业大学学报(自然科学版);2006年02期
2 李朝晖,余英林,张为,邹艳碧;小波-神经网络在视频文本自动检测中的应用[J];广州大学学报(社会科学版);2001年05期
3 李朝晖,余英林,黄海康;基于形态学的视频文本自动检测[J];计算机应用研究;2005年02期
4 李朝晖,余英林;基于边缘信息和LH的视频文本自动检测[J];计算机应用研究;2004年12期
5 李茹,李弼程;基于D-S证据理论的邮件筛选方法[J];计算机工程与设计;2005年10期
6 王策,何炎祥,王云,张春林;基于视音频特征和文本信息的新闻视频自动场景分割[J];计算机工程;2005年06期
7 王爱胜;“文本信息加工”到底要加工什么[J];信息技术教育;2005年03期
8 朱成军;李超;熊璋;;视频文本检测和识别技术研究[J];计算机工程;2007年10期
9 彭培华,曲波,陈荣胜;基于支持向量机的小波域视频字幕检测与提取[J];华南理工大学学报(自然科学版);2004年S1期
10 姜东焕;冯象初;宋国乡;;依赖Besov权的平移不变小波阈值方法[J];工程数学学报;2006年03期
11 王建,周源华;一种基于纹理能量的JPEG图像文本定位算法[J];上海交通大学学报;2004年09期
12 李朝晖,余英林;一种视频文本自动定位、跟踪和识别的方法[J];中国图象图形学报;2005年04期
13 陶茂垣;卢正鼎;袁武钢;凌贺飞;邹复好;;基于图像尺度空间的几何不变特征点提取算法[J];电子学报;2006年S1期
14 黄剑华;唐降龙;刘家锋;徐莉莉;;一种基于Homogeneity的文本检测新方法[J];智能系统学报;2007年01期
15 方亦凯;程健;汪孔桥;卢汉清;;基于快速尺度空间特征检测的手势识别方法[J];中国图象图形学报;2009年02期
16 吴月娥;边后琴;;尺度与特征引导视觉选择性注意机制模型[J];现代电子技术;2009年22期
17 高峰;魏少华;王学通;;基于SIFT特征点的图像匹配算法[J];现代电子技术;2010年18期
18 傅立言,余松煜;扩散方程的动力学分析[J];计算机学报;1996年04期
19 汪闽,周成虎,裴韬,骆剑承;一种基于数学形态学尺度空间的线性条带挖掘方法[J];高技术通讯;2003年10期
20 晋瑾;平西建;张涛;陈明贵;;图像中的文本定位技术研究综述[J];计算机应用研究;2007年06期
中国重要会议论文全文数据库 前10条
1 李瑞;王朝坤;郑伟;王建民;王伟平;;基于MapReduce框架的近似复制文本检测[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 彭泽映;俞晓明;许洪波;;大规模短文本的不完全聚类[A];第六届全国信息检索学术会议论文集[C];2010年
3 朱辉;李在铭;;视频图像中文本检测与分割技术研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
4 曹剑芬;陈方炘;;基于文本信息的韵律结构预测及其在合成系统中的应用[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
5 羌鑫林;刘许清;杨洁;高剑锋;;浅谈DGN数据中的文本信息到SHP格式的转换[A];地理信息与物联网论坛暨江苏省测绘学会2010年学术年会论文集[C];2010年
6 于佳;王燕;;基于SOM的视频中人工文本区域检测方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
7 李广原;冯嘉礼;;基于属性坐标的文本信息检索模型[A];广西计算机学会2005年学术年会论文集[C];2005年
8 林丽玲;;商务口译中文本信息忠实性与文化信息忠实性[A];福建省外国语文学会2008年年会论文集[C];2008年
9 王雷;肖学年;;尺度空间中的地理认知与比例空间中的地图表达[A];中国地理信息系统协会第三次代表大会暨第七届年会论文集[C];2003年
10 朱朝霞;;预期推理的结果及其表征的研究[A];第十届全国心理学学术大会论文摘要集[C];2005年
中国博士学位论文全文数据库 前10条
1 孙巧榆;复杂背景图像的文本信息提取研究[D];华东师范大学;2012年
2 刘楠;视频广告内容分析与理解[D];北京交通大学;2012年
3 彭青松;Bayesian网及其在图像分析中的应用研究[D];合肥工业大学;2005年
4 周景超;视频文本检测算法研究[D];中国科学院研究生院(自动化研究所);2008年
5 李朝晖;基于视频文本检测和视频对象分割方法研究[D];华南理工大学;2004年
6 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年
7 眭新光;文本信息隐藏及分析技术研究[D];解放军信息工程大学;2007年
8 李丽洁;视频中文本信息提取技术研究[D];哈尔滨工程大学;2012年
9 王智慧;可还原式数据嵌入技术的研究[D];大连理工大学;2010年
10 黄晓冬;基于特征融合的视频文本获取研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈丽娇;基于极大稳定极值区的视频文本检测算法研究[D];大连理工大学;2012年
2 于佳;基于SOM的视频中人工文本检测方法研究[D];哈尔滨工程大学;2010年
3 赵妍;视频文本检测研究[D];南京大学;2012年
4 王瑾;局部轮廓信息描述结合学习分类的文本检测技术研究[D];燕山大学;2010年
5 孙小亮;基于多帧融合的视频文本检测[D];北京邮电大学;2011年
6 肖鹏元;基于GPU并行计算的重复文本检测系统[D];浙江大学;2011年
7 马丽娜;基于LVQ的视频文本检测方法研究[D];哈尔滨工程大学;2012年
8 韩红斌;医学影像中文本信息嵌入技术研究与实现[D];沈阳航空工业学院;2010年
9 邹莎莎;文本信息结构抽取方法的研究[D];大连理工大学;2010年
10 罗永峰;文本信息的空间化Web GIS应用研究[D];东北师范大学;2003年
中国重要报纸全文数据库 前10条
1 闫洁;咱的信息:运营商保留那么久干啥?[N];新华每日电讯;2008年
2 蒋秀娟;常发短信会使人变笨吗?[N];科技日报;2007年
3 童岱;手机短信稳私安全吗[N];北京科技报;2008年
4 吴辰光;三大厂商抢食07年游戏机市场[N];北京商报;2007年
5 山东 牟晓东;三种清除空格的方法[N];电子报;2008年
6 周蓉蓉;移动时代的变迁[N];计算机世界;2006年
7 山东 牟晓东;加密文字信息技巧两则[N];电子报;2008年
8 王朝选;讯飞语音助力中国航天[N];中国高新技术产业导报;2008年
9 李杰 李阳敏;短信:天上掉下个大馅饼?[N];计算机世界;2001年
10 本版编辑王薇 杨晴川 张代蕾;底特律市长被控作伪证[N];新华每日电讯;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978