收藏本站
《华南理工大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于视频文本检测和视频对象分割方法研究

李朝晖  
【摘要】:本文围绕与MPEG-7相关的关键技术之一——视频文本检测、定位和抽取方法进行了研究,由于视频文本的检测、定位、抽取和识别受背景的复杂度、对比度、分辨率、字体大小、排列方向、字形、运动方式等因素的影响,需考虑的因素较多,算法比较复杂。本文的主要工作即是针对国内外涉足较少的视频文本检测进行了较为深入的研究,为实现如何降低算法的复杂度、提高算法的鲁棒性和准确性这一目标,本文做了如下的工作: 1.提出了一种基于边缘信息和LH的方法检测视频帧文本所在的位置,边缘检测用Sobel算子,将检测到的边缘,经强度、密度检测后,计算其LH的值,经凸台检测后,得到文本区域的定位结果。实验表明这种方法计算简单,能快速地定位文本区域,且不受文本颜色、字形等的限制。对水平或垂直方向排列的视频文本,检测和分割效果良好。 2.提出一种基于小波和LH的检测算法,采用多分辨率的分析方法,不但考虑了水平和垂直方向的高频分量,也考虑了对角方向的高频分量,用具有良好时频局部特性和变尺度特性的小波分析方法提取出不同空间分辨率、不同方向的边缘子图象后经过强度和密度检测,用LH的方法进一步定位文本目标区域。实验表明这种方法由于采用多分辨率的分析方法,可对字体大小差别较大的视频文本进行检测,且不受文本颜色、字形等的限制。对水平或垂直方向排列的视频文本,检测和分割效果良好。 3.提出用形态学进行视频文本检测的两种方法。第一种方法结合了小波多分辨率的分析方法及形态学具有几何形状分析的特点,用小波分析方法提取文本的高频分量后,用形态学的方法进行进一步的处理,这样可不受文本排列方向的限制。第二种方法是提出一种基于形态学的方法提取边缘子图像,所提取的边缘具有良好的形状保持性。在提取到边缘子图像后,再通过区域标记、连通分量分析、形态后处理等一系列步骤对视频帧进行滤波,得到视频文本检测结果,最后再对其进行二值化处理,把文本字符从复杂背景中分离出来。实验表明这种方法可以
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP391.41

【引证文献】
中国硕士学位论文全文数据库 前3条
1 刘华颖;基于角点与颜色特征的视频文本提取算法[D];河北大学;2011年
2 郭金林;辅助视频情报分析的字幕探测技术研究[D];国防科学技术大学;2008年
3 潘道远;基于多方法融合的文本定位算法的设计与实现[D];江苏大学;2010年
【参考文献】
中国期刊全文数据库 前8条
1 张宗念,余英林,马义德;MPEG—4的视频“档次”及其“等级”技术[J];电视技术;1999年11期
2 卢官明;MPEG-7标准的目标及应用[J];电视技术;1999年11期
3 张颖,张兆扬,高磊;MPEG-4的验证模型及其图象分割技术[J];电视技术;1998年02期
4 李朝晖,王秀峰;影视字幕文字识别的研究[J];计算机工程;2002年03期
5 黄晓东,周源华;用小波变换及颜色聚类提取的视频图像内中文字幕[J];计算机工程;2003年01期
6 卢官明,毕厚杰,江平;MPEG-4视频验证模型[J];南京邮电学院学报(自然科学版);1999年01期
7 欧国斌,张利,谢攀;视频信号中实时字幕信息的提取方法[J];清华大学学报(自然科学版);2002年07期
8 刘国锋,诸昌钤;光流的计算技术[J];西南交通大学学报;1997年06期
【共引文献】
中国期刊全文数据库 前10条
1 司圣柱;小波变换方法及其在化学中的应用[J];安徽教育学院学报;2004年03期
2 司圣柱;王丽平;董雄辎;;小波变换-主成分回归法在四组分食用色素同时测定中的应用研究[J];合肥师范学院学报;2009年06期
3 王丽平;司圣柱;董雄辎;;小波变换-偏最小二乘法用于多组分混合物光度法同时测定[J];合肥师范学院学报;2010年06期
4 朱明星,张德龙;RBF网络基函数中心选取算法的研究[J];安徽大学学报(自然科学版);2000年01期
5 李景福;赵进辉;龙志军;刘诗安;;基于离散小波变换的农业图像处理研究[J];安徽农学通报;2007年03期
6 李广明;詹锦川;黄立平;朱轶峰;闵新力;;BP神经网络在确定蔬菜生产企业关键控制点阈值中的应用[J];现代农业科技;2006年11期
7 刘立波;基于数学形态学的二值图像骨架抽取算法[J];安庆师范学院学报(自然科学版);2004年01期
8 吕英华;牛守强;;基于MATLAB的金属材料显微图像处理[J];鞍山科技大学学报;2006年03期
9 苏中;夏艳;吴细宝;;基于激光双目视觉系统的直径测量[J];半导体光电;2008年01期
10 王会峰;刘永奎;汪大宝;;基于小波和Zernike矩的标尺靶亚像素检测算法[J];半导体光电;2010年06期
中国重要会议论文全文数据库 前10条
1 刘吉成;汪熙;王仲;刘爱勇;;基于虚拟环境的摄像机定标中的矩阵研究[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
2 陈海燕;郭克华;王洪南;赵春霞;;基于各向异性分布偏微分方程的路面图像平滑技术[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
3 王波;王炳锡;王杰锋;;小波变换和希尔伯特变换在语音信号处理中的应用[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 宋雪静;吴仁彪;刘家学;;基于GPR的机场跑道灾害识别[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
5 朱长明;杨辽;骆剑承;沈占锋;沈金祥;;SPOT数据模拟真彩色的非线性方法研究[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
6 刘松林;陈杰;郝向阳;西勤;;玻壳缺陷检测与几何量测视觉系统的设计与实现[A];2009年全国测绘仪器综合学术年会论文集[C];2009年
7 张雄;毕笃彦;熊磊;;MPEG-4基于内容的视频编码与视频图像分割[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
8 冯毅;张铁强;林晓珑;;利用成像法测微小直径的研究[A];2004全国光学与光电子学学术研讨会、2005全国光学与光电子学学术研讨会、广西光学学会成立20周年年会论文集[C];2005年
9 邹月娴;王一言;关佩;杨华;陈维荣;;复杂视频背景中的运动车辆检测技术[A];第四届和谐人机环境联合学术会议论文集[C];2008年
10 ;A new algorithm for text segmentation based on stroke filter[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中国博士学位论文全文数据库 前10条
1 王文标;基于视觉测量的快速再制造成形系统关键技术研究[D];大连海事大学;2010年
2 时长江;豆科类杂草种子图像识别系统研究[D];中国海洋大学;2009年
3 肖洁;视觉注意模型及其在目标感知中的应用研究[D];华中科技大学;2010年
4 朱清波;序列图像三维重建方法研究[D];华中科技大学;2010年
5 王晓松;复杂背景下树木图像提取研究[D];北京林业大学;2010年
6 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
7 康锋;基于视觉特征的早期农林火灾检测方法的基础研究[D];浙江大学;2010年
8 张海龙;110~220kV XLPE电缆绝缘在线检测技术研究[D];武汉大学;2009年
9 张淑平;基于视觉的并联机器人位姿检测方法研究[D];东华大学;2010年
10 赵红强;基于小波分析的我国经济运行特征研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 宋抗;压缩机活塞圆度误差数字检测系统研究[D];河南理工大学;2010年
2 杨焱麟;基于小波变换理论与比值分析法的变压器励磁涌流识别的研究[D];山东科技大学;2010年
3 王春华;基于盲源分离的肺音信号提取研究[D];山东科技大学;2010年
4 郑莉;DSP在集装箱加强板焊接定位系统中的应用[D];山东科技大学;2010年
5 张杨;基于双目立体视觉的CCD测距系统设计[D];长春理工大学;2010年
6 杨雪娇;点云的边界提取及角点检测算法研究[D];哈尔滨工程大学;2010年
7 王颖芳;基于特定内容的敏感图像过滤技术的研究[D];哈尔滨工程大学;2010年
8 于佳;基于SOM的视频中人工文本检测方法研究[D];哈尔滨工程大学;2010年
9 李惠;稳定分布盲分离方法及应用研究[D];哈尔滨工程大学;2010年
10 周黎黎;EPIRB检测仪测频技术方案设计与研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 符静;数据挖掘:情报学的发展[J];大学图书情报学刊;2005年04期
2 张佑生,彭青松,汪荣贵;一种基于变异灰度直方图的视频字幕检测定位方法[J];电子学报;2004年02期
3 梁光明,孙即祥,马琦,姚春光;Otsu算法在Canny算子中的应用[J];国防科技大学学报;2003年05期
4 段瑞玲,李庆祥,李玉和;图像边缘检测方法研究综述[J];光学技术;2005年03期
5 周鲜成;;图像分割方法及其应用研究综述[J];信息技术;2007年12期
6 杨光宇;佟鑫新;朱丹;;一种基于FPGA的实时直方图统计方法[J];机电工程;2007年04期
7 郑翠翠;王兴起;;基于边缘信息和局部直方图的视频文字检测法[J];机电工程;2009年10期
8 朱兴全,薛向阳,吴立德;一种自动门限选取的视频Shot分割方法[J];计算机研究与发展;2000年01期
9 王蓉蓉,金万军,吴立德;一种新的利用多帧结合检测视频标题文字的算法[J];计算机研究与发展;2005年07期
10 张二虎,张绪进,段敬红;一种改进的基于DCT压缩域的图像字符定位方法[J];计算机工程与应用;2004年27期
中国博士学位论文全文数据库 前3条
1 谢毓湘;辅助情报分析的新闻视频挖掘技术研究[D];国防科学技术大学;2004年
2 章东平;视频文本的提取[D];浙江大学;2006年
3 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前8条
1 韩智广;辅助视频情报分析的字幕探测技术研究与实现[D];中国人民解放军国防科学技术大学;2002年
2 朱志辉;面向传输的视频结构化与摘要生成技术研究[D];湖南大学;2005年
3 李永波;基于数据挖掘的军事情报分析系统研究[D];重庆大学;2005年
4 孟天;自然场景下的文本定位[D];西安电子科技大学;2007年
5 张丽;基于小波的视频中人工文本检测方法研究[D];哈尔滨工程大学;2007年
6 吴桂兰;基于边缘信息的文本区域提取算法的研究[D];北京交通大学;2008年
7 王芳;传统聚类方法的分析及改进[D];中南大学;2007年
8 陈前;多方法融合的类圆形堆积物区域分割[D];中南大学;2008年
【二级参考文献】
中国期刊全文数据库 前1条
1 戴青云,余英林;一种基于小波与形态学的车牌图象分割方法[J];中国图象图形学报;2000年05期
【相似文献】
中国期刊全文数据库 前10条
1 吴四清;张国平;葛镜;;基于内容检索的视频分割技术的研究[J];电脑与信息技术;2006年05期
2 王昕;;视频对象分割技术与应用[J];中国有线电视;2011年01期
3 刘李杰,蔡德钧,翁南钐;一种面向运动的视频对象分割算法[J];计算机学报;2000年12期
4 肖国强;刘建平;;一种基于非线性尺度空间的视频对象分割方法[J];计算机工程与科学;2007年03期
5 宋立锋,韦岗,王群生;基于模板匹配的视频对象分割[J];电子学报;2002年07期
6 于跃龙;卢焕章;;基于背景构造的视频对象分割技术[J];计算机工程与科学;2006年01期
7 吴四清;张国平;徐云强;;CBR中基于区域的视频分割技术[J];信息通信;2006年05期
8 顾广华;崔冬;;全局运动序列的视频对象分割算法[J];仪器仪表学报;2007年01期
9 许立;马利庄;聂栋栋;;交互式视频对象分割系统的设计与实现[J];计算机应用与软件;2007年08期
10 陈韩锋,戚飞虎;视频对象分割中基于Gibbs随机场模型的时空分割结合方法[J];电子学报;2004年01期
中国重要会议论文全文数据库 前10条
1 沈庆华;李树涛;李怡;;基于小波变换和形态学的复杂背景文本定位[A];第二十六届中国控制会议论文集[C];2007年
2 李瑞;王朝坤;郑伟;王建民;王伟平;;基于MapReduce框架的近似复制文本检测[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 胡芊;杨正球;;基于去噪声的视频图像中的字幕提取[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 钟辉;黄洋;;基于版面特征的文档图像的文本定位方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
5 朱辉;李在铭;;视频图像中文本检测与分割技术研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 汪小洁;韩潇;;一种基于运动窗的时空视频分割算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
7 袁辉;孙卓;李德民;魏颖;;基于小波多尺度互能量交叉融合滤波的弱小目标检测算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
8 于佳;王燕;;基于SOM的视频中人工文本区域检测方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
9 邹斌;周爽;张枫;刘晨;;基于小波变换的海面红外小目标检测[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 李小红;蒋建国;郭太峰;詹曙;;基于小波零树编码方法的改进与实现[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
中国重要报纸全文数据库 前10条
1 ;剖析“职务激励”的错误[N];组织人事报;2005年
2 四川 刘江;联想LXH-1569型多频数控彩显扬扫描故障分析[N];电子报;2005年
3 四川 杨泽兴;漫话宽频扬声器[N];电子报;2007年
4 ;物流信息系统(中)[N];现代物流报;2006年
5 王菊虞乐;智能天线敢不敢下倾[N];通信产业报;2007年
6 吴暑明;3英寸当道 宽屏幕风靡[N];中国消费者报;2008年
7 肖锡然(辽宁,04级研修班);临《郑文公下碑》有感[N];中国艺术报;2005年
8 余晓萍;让笔记本电脑如F1赛车般安全[N];中国计算机报;2006年
9 中山大学社会学博士 叶涯剑;空间愉悦感从何而来?[N];中国房地产报;2007年
10 山东 国韵;金瑯优闲5号音箱赏析[N];电子报;2005年
中国博士学位论文全文数据库 前10条
1 李朝晖;基于视频文本检测和视频对象分割方法研究[D];华南理工大学;2004年
2 章东平;视频文本的提取[D];浙江大学;2006年
3 彭青松;Bayesian网及其在图像分析中的应用研究[D];合肥工业大学;2005年
4 包红强;基于内容的视频运动对象分割技术研究[D];上海大学;2005年
5 刘楠;视频广告内容分析与理解[D];北京交通大学;2012年
6 许剑峰;数字视频中的文本分割的研究[D];华南理工大学;2005年
7 张庆利;视频对象自动分割技术及其细胞神经网络实现方法的研究[D];上海大学;2005年
8 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年
9 符祥;视频网络传输中面向对象处理的关键技术研究[D];西安电子科技大学;2008年
10 朱向军;视频运动对象分割与先进运动估计/运动补偿算法之研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 吴智恺;基于笔画特征的多方法综合视频文本提取算法研究[D];上海交通大学;2010年
2 时阳;新闻视频中文本检测和定位技术的研究[D];北京邮电大学;2009年
3 陈森;自然场景图像中的文本定位方法及应用研究[D];华南理工大学;2011年
4 陈丽娇;基于极大稳定极值区的视频文本检测算法研究[D];大连理工大学;2012年
5 于佳;基于SOM的视频中人工文本检测方法研究[D];哈尔滨工程大学;2010年
6 仲亮亮;视频对象分割与跟踪方法研究[D];中国石油大学;2010年
7 王瑾;局部轮廓信息描述结合学习分类的文本检测技术研究[D];燕山大学;2010年
8 赵琳琳;时空融合视频对象分割技术研究[D];吉林大学;2012年
9 赵妍;视频文本检测研究[D];南京大学;2012年
10 罗洪刚;用于网络动画过滤的文字提取算法研究[D];上海交通大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026