收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

自然场景文本信息提取关键技术研究

刘晓佩  
【摘要】:图像中的文字信息作为场景内容的一部分,往往为人们或计算机理解场景提供了直接而关键的线索。比如路牌、商店招牌、交通提示牌和各种建筑物上的文字信息,这些文字信息都具有明确的含义,是场景信息的重要表现形式。因此,自动提取场景中的文本信息可广泛应用于各种需要对场景中的文本进行分析和理解的场合,如视频和图像检索系统,涉外导游自动翻译、盲人引路、机器人行走和智能监控系统等。该课题目前已成为计算机视觉和文档分析领域的研究热点之一。本文对自然场景文本信息提取的关键技术进行了深入的研究,论文取得了以下主要研究成果: 1.从频域出发,提出了一种将纹理分析和模板匹配验证策略相结合的复杂文本定位方法。考虑到具有一定宽度和方向的文字笔画可视为一种带通信号,而小波变换在捕捉这种带通信号方面具有较大的优势。首先将输入图像进行小波变换,提取每个像素局部区域的纹理统计特征,采用蚁群聚类算法进行聚类分析,并结合基于密度的区域生长算法得到文本候选区域;然后提取候选文本块的LBP-HF特征,利用模板匹配的方式进行文本和非文本的确认,最后得到文本区域的位置。 2.针对复杂场景中文本和非文本难以有效区分的问题,将小波变换和多尺度LBP算子相结合,提出了一种能够有效表达文本模式的WTLBP特征。在此基础上,提出了一种基于WTLBP特征和支持向量机(Support Vector Machine, SVM)的复杂场景文本定位方法。算法首先根据中文文字的结构及笔画方向特点,设计合适的边缘检测算子提取文字的笔画边缘,进行形态学滤波后形成备选文本区域集合;然后提取候选文字区域的WTLBP特征,结合SVM分类器实现文本区域的确认。 3.针对文本验证时仅考虑其区域特征而忽视文本区域的空间位置关系的问题,提出了一种基于多特征和图割模型的场景文本验证方法。算法首先分析了候选文本连通区域的空间关系及其在候选文本区域验证中的作用;然后根据文本区域的空间关系,建立候选文本区域的邻域连接图。在此基础上,将候选文本区域映射为一个有权无向图,以组合优化的方式将候选文字区域标记为文本或背景。实验结果验证了算法的有效性。 4.针对复杂场景文本难以有效分割的问题,提出了一种基于扩展马尔可夫随机场(Markov Random Field, MRF)模型的场景文本分割方法。首先分析了经典MRF模型的优势和不足,提出了一种扩展的MRF模型。其次,在分析场景文本特点的基础上,提取文本的颜色和最大梯度差(Maximum Gradient Difference,MGD)特征,将文本的上下文信息与多特征统一在同一概率框架下,利用图割算法对所建立的模型进行推断。最后在两种数据库上,对算法的性能进行了测试比较,结果表明了所提出的模型适合处理复杂情况下的文本分割问题。 5.针对复杂场景文本的多样性,提出了一种基于局部颜色一致性和图割模型的复杂场景文本分割方法。算法首先利用文字笔画颜色一致性特点,采用SLIC算法将输入图像分割为若干局部同质区域,将局部区域代替像素点构建图模型;其次,根据文字笔画的双边缘特点,自动提取文字和背景种子点;提出采用两种模型构建文本和背景模型,并引入模型性能描述因子自适应学习模型参数。实验结果表明了算法在复杂场景文本方面的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 彭浩;陈继锋;刘琼;王海涛;高海波;;一种面向聚焦爬虫的自然场景文本定位技术[J];小型微型计算机系统;2014年09期
2 戴津;;自然场景中文本检测技术研究综述[J];计算机光盘软件与应用;2013年18期
3 古辉;芦亚亚;丁维龙;王杰;张维统;;自然场景下果实目标的识别和定位[J];浙江工业大学学报;2007年03期
4 皮学贤;李思昆;宋君强;;一种新的离散格子气模型及其在自然场景仿真中的应用[J];计算机工程与科学;2006年10期
5 杨丹;李博;赵红;;鲁棒视觉词汇本的自适应构造与自然场景分类应用[J];电子与信息学报;2010年09期
6 刘宏;普杰信;;一种改进的自然场景特征提取方法[J];计算机工程;2011年21期
7 宋文;肖建于;;基于笔画宽度变换的自然场景文本检测方法[J];计算机工程与应用;2013年09期
8 张冬梅;张全元;郑达;郑蔚;李晖;戴光明;;一种新的自然场景标志牌文本提取算法[J];计算机工程与应用;2007年24期
9 常莹;何东健;李宗儒;;基于聚类与边缘检测的自然场景文本提取方法[J];计算机工程与设计;2010年18期
10 徐琼;干宗良;刘峰;陈昌红;;基于提升树的自然场景中文文本定位算法研究[J];南京邮电大学学报(自然科学版);2013年06期
11 陆培源;王建中;施家栋;;基于纹理基元与颜色的室外自然场景分类[J];北京理工大学学报;2011年11期
12 钱建平;杨信廷;吴晓明;陈梅香;吴保国;;自然场景下基于混合颜色空间的成熟期苹果识别方法[J];农业工程学报;2012年17期
13 黄银君;陶青川;;自然场景下水体目标提取算法研究[J];通信技术;2013年03期
14 金伟民,毛和法,王辉;室外自然场景体视彩虹全息图的制作方法研究[J];光子学报;2005年01期
15 张朋;杨放;邱兆杰;郭陈江;许家栋;;自然场景的SAR图像模拟(英文)[J];系统仿真学报;2007年02期
16 张朋;黄金;郭陈江;许家栋;;一种自然场景的SAR图像模拟方法[J];弹箭与制导学报;2005年SC期
17 田明辉;万寿红;岳丽华;;自然场景中的视觉显著对象检测[J];中国图象图形学报;2010年11期
18 杨玲贤;陈和平;陈黎;;基于可控金字塔的无参考图像质量评价模型[J];计算机工程与设计;2013年08期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 霍静萍;杜建政;;自然场景视觉记忆中颜色的作用途径[A];第十一届全国心理学学术会议论文摘要集[C];2007年
中国博士学位论文全文数据库 前3条
1 吴锐;自然场景中文本识别技术研究及实现[D];哈尔滨工业大学;2010年
2 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年
3 刘晓佩;自然场景文本信息提取关键技术研究[D];西安电子科技大学;2014年
中国硕士学位论文全文数据库 前10条
1 杨帆;基于脑电的自然场景下目标的快速识别研究[D];云南大学;2014年
2 王炜;基于角点和颜色的自然场景文字定位技术研究[D];西安电子科技大学;2011年
3 葛巧瑞;自然场景下的文字分割及识别研究[D];西安电子科技大学;2012年
4 刘宏;基于双目视觉的自然场景感知[D];河南科技大学;2011年
5 覃香;自然场景下苹果检测系统的研究与实现[D];西北农林科技大学;2011年
6 汪文芳;基于移动终端的自然场景文本定位和识别[D];西安电子科技大学;2011年
7 廖威敏;面向自然场景的端对端英文文字识别研究[D];厦门大学;2014年
8 芦亚亚;自然场景下果蔬识别定位系统的关键技术研究[D];浙江工业大学;2007年
9 霍静萍;自然场景视觉记忆中颜色的作用[D];河南大学;2007年
10 王冠夫;移动机器人基于视觉的室外自然场景理解[D];大连理工大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978