收藏本站
《中国科学院研究生院(计算技术研究所)》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

图像和视频文字检测技术研究

叶齐祥  
【摘要】: 图像和视频中的文字是一种包含丰富信息的对象,对于视频内容分析、检索,图片内容理解等研究领域有重要作用。不同于其他典型模式(如单个汉字字符模式、人脸模式等),成行的文字在大小、灰度、形状、颜色等属性上具有很强的不一致性,在很多情况下文字还处于复杂的背景中,这给文字的检测和识别带来了巨大的困难。而且传统的使用机器学习方法直接检测图像块模式的方法不适合于文字检测问题。因此,本文基于由粗到精的检测思想,提出了适用于几种典型文字((1)视频叠加文字,(2)自然场景图像中的文字,(3)单个数字字符)的一个通用检测框架,在文字检测过程中,我们总是依赖于最可靠的特征进行文字粗定位,然后融合其他特征对候选文字进行验证。这样既提高了检测速度,又能够保证高的检测精度。在三种具体样例上,详细的分析了由粗到精的思想对于文字检测的有效性和重要性。在本文的总结和扩展中,讨论了将由粗到精的检测方法推广到检测图像中的其他纹理对象的可行性。 对于视频帧中的叠加文字,作者使用了多尺度的小波特征进行检测。在这个研究中,我们着重研究了如何融合、选择有效的底层特征用于区分文字行和非文字行模式。首先,在文字行的粗定位程序中使用了小波能量特征和全局直方图分析的阈值确定方法检测候选文字象素,然后提出了一种“基于密度”的区域增长方法将离散的像素连接成为候选文字区域。对于检测到的候选文字区域,使用结构特征分割为单个的文字行。在精确分类过程中,融合了三种纹理特征和一种结构特征来表达文字行模式,使用了前向特征选择算法进行了融合特征的筛选。最后,基于选择的纹理特征,使用了支持向量机(SVM)方法分类文字行和非文字行模式。实验表明,算法能够快速,鲁棒的检测视频叠加文字。视频文字的背景往往是复杂的,基于图像灰度信息的OCR软件不能取得好的识别效果。为此,作者提出了一种从复杂背景中分割文字前景的算法。在此方法中,作者基于Canny边缘检测结果提出了一种采样规则,并且使用混合高斯模型(GMMs)对于采样像素在色度-亮度二维特征空间内建立颜色模型,然后使用颜色模型准确地检测所有前景像素。这种先采样后检测的方法,使得文字分割完全自动并且具有很好的效果。 对于自然场景图像中的文字,在由粗到精的检测框架内,作者融合了颜色、小波直方图、OCR识别结果统计特征。并且研究了如何从复杂的图像中分割和定位文字行模式和对于发生了仿射形变的文字行进行恢复的方法。在此过程中,对图像分割技术、区域布局分析技术在文字行定位过程中的作用进行了深入的研究。对本文提出的由粗定位到精分类的检测框架进行了深化和验证。对于仿射形变文字行的恢复,利用了平面间的Homography运算,不需要任何摄像机参数。 最后,作者研究了一种更为难于检测的文字模式——具有非刚体形变的字符(运动衫号码)。在这种字符的检测中,主要的困难来源于文字的扭曲变形,这种变形是非刚体
【学位授予单位】:中国科学院研究生院(计算技术研究所)
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP391.4

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 陈锡威;梁婷;;微摄影时代——单反相机在电视节目拍摄中的应用[J];西部广播电视;2014年12期
2 杨大力;翁正新;;图像校正技术的研究及应用[J];控制工程;2008年S1期
中国博士学位论文全文数据库 前1条
1 李丽洁;视频中文本信息提取技术研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 李振;多源医疗数据的智能分析与应用研究[D];郑州大学;2018年
2 武军亮;增值税发票中有效信息的识别算法研究与实现[D];青岛科技大学;2018年
3 张翮;复杂背景下证件识别技术的研究与实现[D];电子科技大学;2017年
4 徐浩然;基于Harris角点的网络视频中文本区域检测方法的研究[D];吉林大学;2016年
5 王爽;交通警卫公务用车管理系统的分析与设计[D];天津大学;2016年
6 王佳宁;辽宁省广播电视节目监管系统设计与实现[D];东北大学;2015年
7 秦伟;图像文字定位与提取技术研究[D];哈尔滨工程大学;2015年
8 王天昊;基于OCR的发票真伪自动鉴别方法研究[D];哈尔滨工程大学;2014年
9 马珂;监控视频中的文字检测[D];华南理工大学;2014年
10 高士林;图像中的文本定位技术研究[D];解放军信息工程大学;2014年
【参考文献】
中国期刊全文数据库 前2条
1 叶齐祥,高文,王伟强,黄铁军;一种融合颜色和空间信息的彩色图像分割算法[J];软件学报;2004年04期
2 张引,潘云鹤;复杂背景下文本提取的彩色边缘检测算子设计[J];软件学报;2001年08期
【共引文献】
中国期刊全文数据库 前10条
1 XIE Jia-li;LI Yong-shu;CAI Guo-lin;WANG Feng;LI He-chao;;An improved Mahalanobis distance-based colour segmentation method for rural building recognition[J];Journal of Mountain Science;2018年07期
2 赵宏伟;王也然;刘萍萍;苗壮;;利用位置信息熵改进VLAD的图像检索方法[J];哈尔滨工程大学学报;2018年08期
3 杨红亚;赵景秀;徐冠华;刘爽;;彩色图像分割方法综述[J];软件导刊;2018年04期
4 谢嘉丽;李永树;李何超;吴玺;;利用灰度共生矩阵纹理特征识别空心村损毁建筑物的方法[J];测绘通报;2017年12期
5 王晓予;向军;潘如如;梁惠娥;高卫东;;服饰刺绣图案的自动提取与色块分割[J];纺织学报;2017年09期
6 鲁娟;;无人机在海上舰船目标识别中的应用[J];舰船科学技术;2017年12期
7 方坤礼;廖建平;刘晓辉;;基于改进JSEG技术的茶叶图像嫩芽分割与识别研究[J];食品工业;2017年04期
8 邹旭华;叶晓东;谭治英;;一种密度峰值聚类的彩色图像分割方法[J];小型微型计算机系统;2017年04期
9 丁汀;;结合颜色和区域生长的茶叶图像分割算法研究[J];福建茶叶;2017年02期
10 赵婧;曹江涛;;视觉传感系统的自主移动机器人路径规划方法[J];传感器与微系统;2016年08期
【同被引文献】
中国期刊全文数据库 前3条
1 王涛;;单反相机高清视频浅析[J];渤海大学学报(哲学社会科学版);2013年03期
2 虞耀君;吴德会;;一种车牌图像校正新方法[J];微计算机信息;2007年15期
3 潘武模,焦扬,王庆人;Hough变换在中文名片图像倾斜校正中的应用[J];中文信息学报;2001年03期
中国博士学位论文全文数据库 前5条
1 周景超;视频文本检测算法研究[D];中国科学院研究生院(自动化研究所);2008年
2 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年
3 章东平;视频文本的提取[D];浙江大学;2006年
4 叶齐祥;图像和视频文字检测技术研究[D];中国科学院研究生院(计算技术研究所);2006年
5 许剑峰;数字视频中的文本分割的研究[D];华南理工大学;2005年
中国硕士学位论文全文数据库 前10条
1 王宸敏;基于OCR技术的化验单识别方法研究[D];浙江大学;2017年
2 黄攀;基于深度学习的自然场景文字识别[D];浙江大学;2016年
3 陈得福;基于监督学习的写作风格建模方法研究[D];浙江大学;2016年
4 袁俊淼;基于几何约束的笔划宽度变换(SWT)算法及其字幕文本定位应用[D];电子科技大学;2015年
5 王志瑜;基于OCR成绩单录入系统的设计与实现[D];吉林大学;2015年
6 谢志钢;面向增值税发票的图像自动处理技术研究[D];上海交通大学;2015年
7 宋韧;基于图像处理和模式识别的身份证识别系统设计与实现[D];电子科技大学;2015年
8 万松;基于Tesseract-OCR的名片识别系统的研究与实现[D];华南理工大学;2014年
9 闫海娜;新闻视频语义概念检测[D];电子科技大学;2014年
10 吴丹敏;复杂背景下视频文本提取的研究[D];西安科技大学;2013年
【二级引证文献】
中国期刊全文数据库 前4条
1 应晓剑;;浅谈少儿节目的摄像技巧[J];新闻研究导刊;2018年02期
2 骆然然;鲍敏;沈卫平;费鑫;;超宽幅扫描仪配套织物疵点检测软件设计[J];机电工程;2013年07期
3 白真贵;王正仕;陈辉明;陈广泰;高永军;张海钰;;单相并网逆变器的鲁棒控制研究[J];控制工程;2011年01期
4 田华阁;田学民;邓晓刚;;基于Kalman-OLS的聚丙烯熔融指数软测量[J];控制工程;2010年S1期
中国博士学位论文全文数据库 前2条
1 郑阳;自然场景图像中文本检测技术研究[D];北京科技大学;2018年
2 颜建强;图像视频复杂场景中文字检测识别方法研究[D];西安电子科技大学;2014年
中国硕士学位论文全文数据库 前1条
1 钟阳;嵌入式可穿戴阅读辅助系统设计与实现[D];华东师范大学;2017年
【二级参考文献】
中国期刊全文数据库 前2条
1 柏子游;张勇;虞烈;;一种彩色图像的色彩分割方法[J];模式识别与人工智能;1999年02期
2 孟章荣;各种颜色模型选用需求分析[J];中国图象图形学报;1996年03期
【相似文献】
中国期刊全文数据库 前10条
1 张锦华;孙挺;;引入像点融合度修补的图像边缘化参差拼接实现[J];微电子学与计算机;2014年08期
2 翟逸飞;;基于FPGA的图像边缘处理研究[J];企业技术开发;2013年12期
3 顾长友;妙用Photoshop处理图像边缘[J];电脑知识与技术;2003年08期
4 濮群,余桂;用线性模型检测图像边缘[J];清华大学学报(自然科学版);1988年01期
5 宋建中;;喷雾图像的自动分析[J];光学机械;1988年04期
6 高华;;关于古建筑图像中破损点优化提取仿真[J];计算机仿真;2017年11期
7 刘娟娟;刘斌;;低照度非线性光学图像边缘自适应增强装置设计[J];激光杂志;2017年03期
8 张琳梅;;基于图像边缘增强的改进方法[J];信息系统工程;2016年03期
9 王水萍;邹蕾;;空中模糊目标图像边缘信息的融合与恢复方法[J];科技通报;2014年06期
10 朱庆生;杨世泉;柳锋;;基于图像边缘摘要的快速模板匹配[J];计算机应用研究;2009年02期
中国重要会议论文全文数据库 前10条
1 陆成刚;陈刚;张但;闵春燕;;图像边缘的优化模型[A];'2002系统仿真技术及其应用学术论文集(第四卷)[C];2002年
2 王培珍;杨维翰;陈维南;;图像边缘信息的融合方案研究[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
3 王亮亮;李明;高昕;;强模糊空间目标图像边缘获取方法研究[A];第九届全国光电技术学术交流会论文集(下册)[C];2010年
4 陈炜;张阳阳;孟庆勋;;一种基于Curvelet变换的图像边缘增强方法[A];国家安全地球物理丛书(十)——地球物理环境与国家安全[C];2014年
5 张明慧;;基于模糊蒙片算法的CR图像边缘增强[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
6 杨文秀;陆常周;;最优小波问题探讨[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年
7 周胜灵;丁珠玉;;农产品边缘检测系统研究[A];中国农业工程学会2011年学术年会论文集[C];2011年
8 胡昌伟;屈小波;郭迪;宁本德;陈忠;;基于边缘加权的l_1-l_2范数MRI欠采重建[A];第十七届全国波谱学学术会议论文摘要集[C];2012年
9 杨唐文;王敏杰;秦勇;;融合图像边缘和区域特征的道路检测算法[A];2013年中国智能自动化学术会议论文集(第三分册)[C];2013年
10 韩焱;王明泉;宋树争;;工业射线图像的退化与恢复方法[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(下册)[C];2001年
中国重要报纸全文数据库 前6条
1 侯杰;国产芯片进军移动多媒体市场[N];人民邮电;2003年
2 吴飞;无边距照片打印三部曲[N];中国电脑教育报;2003年
3 成岭;消除Premiere中慢镜头的图像抖动[N];电脑报;2003年
4 ;体验决定一切[N];中国计算机报;2003年
5 Wang JS;抠图又有新招[N];电脑报;2002年
6 ;令挑剔的人也刮目相看[N];中国电子报;2001年
中国博士学位论文全文数据库 前10条
1 齐现英;不确定性信息在图像噪声处理中的应用研究[D];山东大学;2018年
2 王展;基于示温漆图像的温度自动判读算法研究[D];电子科技大学;2018年
3 郭尚伟;图像视觉安全指标研究[D];重庆大学;2017年
4 李永军;图像与视频低复杂度压缩算法研究[D];西安电子科技大学;2017年
5 刘飞;透混沌介质偏振成像技术[D];西安电子科技大学;2016年
6 张珺;单细胞三维结构与衍射图像特征的分类方法研究[D];天津大学;2017年
7 张菲菲;梯度域处理框架下的图像视见度增强技术研究[D];武汉大学;2015年
8 崔扬;图像检测技术在皮革缺陷检测中的应用研究[D];浙江大学;2004年
9 丁艺芳;基于小波变换和视觉系统的图像质量综合评价新算法[D];上海大学;2001年
10 傅霆;医学信号与图像的多尺度分析方法研究[D];电子科技大学;2003年
中国硕士学位论文全文数据库 前10条
1 白荣鑫;基于天空区域识别的物理模型图像去雾算法研究[D];山东师范大学;2018年
2 徐真;基于图像的3D造型交互设计方法研究[D];山东师范大学;2018年
3 刘旸;面向图像编辑的图像导向上采样算法[D];山东大学;2018年
4 张昌盛;浮选泡沫图像特征提取算法的工业应用研究[D];电子科技大学;2018年
5 黄颖;螺旋相位定量检测法测量血红细胞参数的应用基础研究[D];电子科技大学;2018年
6 占志芳;基于分类正交字典训练的图像稀疏重建[D];厦门大学;2017年
7 张海斌;基于zynq实时视频图像去雾系统的设计[D];上海师范大学;2018年
8 孙超;基于运动估计与梯度估计的图像反光去除[D];电子科技大学;2018年
9 周文祥;基于X-ray图像的骨龄自动评估[D];电子科技大学;2018年
10 宋腾飞;先验知识指导的显著性检测研究[D];安徽大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026