收藏本站
收藏 | 论文排版

自然场景中文本识别技术研究及实现

吴锐  
【摘要】: 图像中的文本信息是理解图像内容的重要线索,自然场景中存在着大量的文本信息,这些信息可以为场景理解提供极有价值的帮助。因而,研究一种自动化的文本信息识别工具,自动从自然场景图像中识别出文本内容,对场景图像的检索、分析以及场景理解均有重要意义。 传统文档分析技术尽管已经取得了巨大的成果,但无法有效处理自然场景中的文本字符。自然场景中的文本图像与传统文档图像相比具有明显不同,表现在文本图像的颜色、亮度、对比度不一致;文本所在的背景复杂多变;文本图像存在变形、残缺、模糊、断裂现象;图像中可能包含强烈的噪声干扰,等等。这些因素使得自然场景文本识别技术面临诸多挑战。 本文针对自然环境文本识别相关技术进行研究,重点研究自然场景下文本图像变形的矫正方法、复杂背景下文本图像的分割方法、低质量字符图像的识别方法。具体内容如下: 1.自然场景的文本图像中存在大量透视变形的情况,文本图像发生变形会严重影响文本识别的整体性能。本文对场景图像的透视变形问题进行了研究,并针对自然场景图像中文本行数少,缺乏段落信息,文本边缘不完整的特点,提出了一种基于消失点的变形矫正方法。该方法分两个步骤:1)检测消失点:文本基线的交点就是消失点,对点的检测可以转化为参数空间对线的检测。首先利用数学形态学算子提取文本字符上的边缘端点,接着采用最近邻方法对端点按照文本行的位置进行分类,然后使用最小二乘法在筛选后的端点集合中拟合文本基线,最后通过RANSAC方法选择出一个最优的文本基线集合,在参数空间拟合出消失点对应的直线。2)变形恢复:文本图像的变形参数包含在单应矩阵中,利用消失点的位置信息对单应矩阵中的部分参数进行估计,然后使用单应矩阵对图像实现矫正恢复,获得正视图的文本图像。由于该方法是从文本图像的字符中获得变形参数,不受文本的边缘和段落格式限制,因此可以对场景文本进行处理。实验结果表明,使用本文方法对大量变形的场景文本图像进行矫正后,字符识别率明显提高。 2.字符分割是字符识别前的关键步骤,自然场景下的字符区域常常有复杂的背景,这会给从背景中分割出字符图像造成困难,本文提出了一种基于谱聚类的字符图像分割方法。该方法与通常的谱方法最大的不同是利用颜色空间量化来构造相似矩阵,大大降低了求解特征系统时的复杂度。具体步骤是:1)构造相似矩阵:首先对图像进行HSV空间变换并量化该色彩空间,然后定义基于像素色彩信息、纹理信息、距离信息的相似度函数,并计算各像素之间的相似度,最后以色彩量化区间为元素构造图像的相似矩阵。2)求解特征系统:以相似矩阵对应的拉普拉斯矩阵为特征矩阵建立特征系统,求解该特征系统的最小特征值及其特征向量。3)图像分割:对最小特征值对应的特征向量进行两类划分,建立一个二值指示向量,按照该向量对相似矩阵进行分类,通过分类后的相似矩阵进一步实现原图像的二值分割。对大量场景文本图像进行测试,实验结果表明该方法优于传统的阈值分割方法,也优于基于谱图准则的阈值分割方法。 3.自然场景中文本图像的特点决定了场景文本的质量低下,现有字符识别方法对字符图像的变形、高噪声、低分辨率等问题还不能有效处理。本文对低质量的字符识别问题进行了研究,提出了一种基于改进Gabor小波变换的特征提取方法,并在此基础上实现了一种高鲁棒的汉字识别方法。本文通过分析低质量汉字图像特点,利用Gabor函数良好的频率选择性和方向选择性,构造了一个适合于汉字特征提取的Gabor小波变换,并进一步提出了基于尺度重叠和基于方向预分类的改进小波变换。尺度重叠强化了Gabor滤波器对笔划宽度的选择,方向预分类使得滤波器对笔划方向的选择更有针对性。由于充分考虑了汉字笔划宽度和方向的多峰值分布,优化了小波变换参数,从而获得一种高鲁棒性的汉字特征。在HCL2000标准手写汉字库和低分辨率汉字库上的测试表明,该方法对笔划变形和低分辨率的汉字字符具有良好的适应性,能有效处理质量较差的汉字字符。 最后,利用提出的多个方法,本文建立了一个自然场景文本信息识别系统,通过实验表明该系统在处理自然场景文本图像的有效性。由于本文建立的文本识别系统对输入图像的限制较少,可以认为是针对实际应用系统研究的一个有益探索。值得一提的是,基于颜色空间量化的谱聚类文本分割方法可以为其它图像分割问题提供思路;改进的Gabor小波特征也是对字符变换系数特征的一个补充。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张冬梅;张全元;郑达;郑蔚;李晖;戴光明;;一种新的自然场景标志牌文本提取算法[J];计算机工程与应用;2007年24期
2 黄文州;;基于3ds Max 9插件技术的虚拟自然场景[J];电脑知识与技术;2009年27期
3 田明辉;万寿红;岳丽华;;自然场景中的视觉显著对象检测[J];中国图象图形学报;2010年11期
4 常莹;何东健;李宗儒;;基于聚类与边缘检测的自然场景文本提取方法[J];计算机工程与设计;2010年18期
5 钱文华;陈渊龙;陈乔;徐丹;普园媛;;基于抽象的自然视频纹理合成技术研究[J];电子测量与仪器学报;2011年05期
6 金伟民,毛和法,王辉;室外自然场景体视彩虹全息图的制作方法研究[J];光子学报;2005年01期
7 侯宏旭,李思崑;海浪自然光照场景的模拟[J];内蒙古大学学报(自然科学版);2003年06期
8 孙尽尧,孙洪;自然场景SAR图像的仿真[J];雷达科学与技术;2003年04期
9 张朋;杨放;邱兆杰;郭陈江;许家栋;;自然场景的SAR图像模拟(英文)[J];系统仿真学报;2007年02期
10 陈庆荣;蒋志杰;;自然场景信息提取和验证加工的眼动研究(英文)[J];Journal of Southeast University(English Edition);2010年03期
11 张朋;黄金;郭陈江;许家栋;;一种自然场景的SAR图像模拟方法[J];弹箭与制导学报;2005年SC期
12 陈彦云,严涛,张晓鹏,吴恩华;基于分类及环境特征的树木真实感绘制[J];软件学报;2001年01期
13 陈彦云,林珲,孙汉秋,吴恩华;高度复杂植物场景的构造和真实感绘制[J];计算机学报;2000年09期
14 郭延臣,韦群,孙建,滕鑫紫;自然场景中植物模型的构造和真实感绘制[J];中国科技信息;2005年10期
15 古辉;芦亚亚;丁维龙;王杰;张维统;;自然场景下果实目标的识别和定位[J];浙江工业大学学报;2007年03期
16 牛希泉;梁艳梅;;自然场景下成熟苹果彩色图像分割方法的研究[J];光电子.激光;2007年12期
17 宋成芳;谈奇峰;张龙;龚怿;陈为;彭群生;;风场作用下的动态森林场景的实时仿真[J];计算机辅助设计与图形学学报;2007年03期
18 周平;钟取发;汪亚明;赵匀;;自然场景兴趣区的分量组合-压缩快速分割法[J];浙江大学学报(工学版);2007年04期
19 邱航;陈雷霆;CHEN Jim X;;风场作用下大规模草地场景动态模拟[J];计算机应用研究;2010年08期
20 ;我的第一个动物360°环绕剧场[J];少年电世界;1997年03期
中国重要会议论文全文数据库 前10条
1 谈正;徐伟忠;;自然场景的可控建模及立体显示[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 霍静萍;杜建政;;自然场景视觉记忆中颜色的作用途径[A];第十一届全国心理学学术会议论文摘要集[C];2007年
3 刘丁;程刚;杨延西;;基于自适应模型的自然场景下人体跟踪[A];2005中国控制与决策学术年会论文集(上)[C];2005年
4 于峻伟;;机载SAR图像快速仿真方法研究[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
5 陈永康;;多因子约束的地形多分辨率模型研究[A];第十五届全国遥感技术学术交流会论文摘要集[C];2005年
6 马海清;黄剑华;刘家锋;;基于边缘检测和纹理分析的图像文本定位方法[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
7 冯雷;张建红;;标志牌文本提取的优化算法及计算机仿真[A];高效 清洁 安全 电力发展与和谐社会建设——吉林省电机工程学会2008年学术年会论文集[C];2008年
8 冯雷;孟祥萍;;标志牌文本提取的优化算法及计算机仿真[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
9 包兴;邹斌;郝琳;;InSAR地面场景仿真方法研究[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 谢文军;陈皓;刘晓平;;基于GPU的实时水面模拟方法研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 吴锐;自然场景中文本识别技术研究及实现[D];哈尔滨工业大学;2010年
2 田宏杰;物体视觉记忆的背景效应及其位置特效性[D];北京师范大学;2008年
3 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年
4 徐丰;全极化合成孔径雷达的正向与逆向遥感理论[D];复旦大学;2007年
5 肖学中;基于实例的颜色处理新技术研究[D];上海交通大学;2009年
6 唐奇伶;基于初级视皮层感知机制的轮廓与边界检测[D];华中科技大学;2007年
7 齐国君;多类别模式分类技术及其在多媒体分析上的应用[D];中国科学技术大学;2009年
8 李伦波;自然场景下交通标志的检测与分类算法研究[D];哈尔滨工业大学;2008年
9 王长波;基于物理模型的自然景物真实感绘制[D];浙江大学;2006年
10 周景超;视频文本检测算法研究[D];中国科学院研究生院(自动化研究所);2008年
中国硕士学位论文全文数据库 前10条
1 魏娜;熟悉性对自然场景觉察绩效的影响及机制[D];浙江大学;2013年
2 廖威敏;面向自然场景的端对端英文文字识别研究[D];厦门大学;2014年
3 覃香;自然场景下苹果检测系统的研究与实现[D];西北农林科技大学;2011年
4 刘宏;基于双目视觉的自然场景感知[D];河南科技大学;2011年
5 葛巧瑞;自然场景下的文字分割及识别研究[D];西安电子科技大学;2012年
6 刘振华;自然场景下基于兴趣点聚类的文本提取方法研究[D];湖南大学;2012年
7 汪文芳;基于移动终端的自然场景文本定位和识别[D];西安电子科技大学;2011年
8 王磊;草地场景的模拟与真实感绘制[D];浙江大学;2004年
9 马世勇;场景文本图像的三维矫正方法研究[D];西安电子科技大学;2012年
10 李玥;基于图像信息的简单图形与复杂视觉场景认知过程研究[D];云南大学;2013年
中国重要报纸全文数据库 前10条
1 汪为胜;山水 都市与我[N];美术报;2006年
2 董燕 聂森;哥特式小说的特点[N];人民法院报;2006年
3 金涛;在名师的演讲中聆听教诲[N];中国邮政报;2004年
4 本报记者 缪琴;两栖爬行动物科普馆全国唯一[N];成都日报;2008年
5 李爱国;墨色如云[N];人民日报;2003年
6 顾森;待重把山河描画[N];陕西日报;2008年
7 ■ 中国科学院软件研究所计算机科学重点实验室 ■ 柳有权 杨刚 蔡康颖(博士) ■ 王文成(博士生导师、研究员);视觉享受的幕后功臣[N];计算机世界;2004年
8 张振萌;浅谈新闻宣传画在报纸上的地位和作用[N];中华新闻报;2007年
9 本报记者 刘晖;专业数码 走近身边[N];中国计算机报;2001年
10 记者 张文明;禄丰恐龙谷开园日迎客4000人[N];云南政协报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978