面向自然场景的端对端英文文字识别研究
【摘要】:随着移动互联网的飞速发展及智能手机等移动电子设备的普及,自然场景图像的获取和传输变得越来越便捷。自然场景图像中的文本包含了丰富的信息,人们期待计算机能代替人类自动地检测并提取图像的文本信息。与传统的光学字符识别不同,自然场景中的文本信息提取面临着字体多变、布局不一、背景复杂等问题。近年来,面向自然场景的文本识别研究虽然取得了一定的成果,但是与实际应用的要求还存在较大的差距。因此,面向自然场景的端对端英文文字识别方法的研究不仅具有重要的理论研究意义,而且具有广阔的应用前景。
本文旨在从自然场景图像中提取精确文本位置和正确的文本信息,并构建一个端对端的场景文本识别系统。针对现有研究方法中字符图像特征表示能力不足及过分依赖复杂模型等问题,本文主要开展以下三方面的研究:(1)自然场景中字符的无监督特征提取及其分层表示;(2)自然场景中的文本定位:(3)自然场景中端对端的文字识别系统的框架。本文的主要贡献如下:
1.提出了基于卷积神经网络的无监督特征分层表示算法。我们先利用改进的K-means聚类方法从训练数据中获得基向量,再结合卷积神经网络提取字符图像的特征。
2.提出了由字符到字符串,再到单词的文本分层定位框架。采用最大稳定极值区域(MSER)算法提取字符候选区域。根据字符的空间布局等特征对多层特征过滤后的字符候选区域进行融合。设计了字符串的结构特征,进一步提高文本检测的准确率。
3.设计了端对端的场景文字识别算法框架,实现了实验演示系统。我们把文本检测与字符识别模块进行整合,并设计了基于词典的识别矫正方法。实验结果验证了所提文本识别方法的有效性。
|
|
|
|
1 |
张冬梅;张全元;郑达;郑蔚;李晖;戴光明;;一种新的自然场景标志牌文本提取算法[J];计算机工程与应用;2007年24期 |
2 |
黄文州;;基于3ds Max 9插件技术的虚拟自然场景[J];电脑知识与技术;2009年27期 |
3 |
田明辉;万寿红;岳丽华;;自然场景中的视觉显著对象检测[J];中国图象图形学报;2010年11期 |
4 |
常莹;何东健;李宗儒;;基于聚类与边缘检测的自然场景文本提取方法[J];计算机工程与设计;2010年18期 |
5 |
钱文华;陈渊龙;陈乔;徐丹;普园媛;;基于抽象的自然视频纹理合成技术研究[J];电子测量与仪器学报;2011年05期 |
6 |
金伟民,毛和法,王辉;室外自然场景体视彩虹全息图的制作方法研究[J];光子学报;2005年01期 |
7 |
侯宏旭,李思崑;海浪自然光照场景的模拟[J];内蒙古大学学报(自然科学版);2003年06期 |
8 |
孙尽尧,孙洪;自然场景SAR图像的仿真[J];雷达科学与技术;2003年04期 |
9 |
张朋;杨放;邱兆杰;郭陈江;许家栋;;自然场景的SAR图像模拟(英文)[J];系统仿真学报;2007年02期 |
10 |
陈庆荣;蒋志杰;;自然场景信息提取和验证加工的眼动研究(英文)[J];Journal of Southeast University(English Edition);2010年03期 |
11 |
张朋;黄金;郭陈江;许家栋;;一种自然场景的SAR图像模拟方法[J];弹箭与制导学报;2005年SC期 |
12 |
陈彦云,严涛,张晓鹏,吴恩华;基于分类及环境特征的树木真实感绘制[J];软件学报;2001年01期 |
13 |
陈彦云,林珲,孙汉秋,吴恩华;高度复杂植物场景的构造和真实感绘制[J];计算机学报;2000年09期 |
14 |
郭延臣,韦群,孙建,滕鑫紫;自然场景中植物模型的构造和真实感绘制[J];中国科技信息;2005年10期 |
15 |
古辉;芦亚亚;丁维龙;王杰;张维统;;自然场景下果实目标的识别和定位[J];浙江工业大学学报;2007年03期 |
16 |
牛希泉;梁艳梅;;自然场景下成熟苹果彩色图像分割方法的研究[J];光电子.激光;2007年12期 |
17 |
宋成芳;谈奇峰;张龙;龚怿;陈为;彭群生;;风场作用下的动态森林场景的实时仿真[J];计算机辅助设计与图形学学报;2007年03期 |
18 |
周平;钟取发;汪亚明;赵匀;;自然场景兴趣区的分量组合-压缩快速分割法[J];浙江大学学报(工学版);2007年04期 |
19 |
邱航;陈雷霆;CHEN Jim X;;风场作用下大规模草地场景动态模拟[J];计算机应用研究;2010年08期 |
20 |
;我的第一个动物360°环绕剧场[J];少年电世界;1997年03期 |
|