收藏本站
《华南理工大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

数字视频中的文本分割的研究

许剑峰  
【摘要】:如今多媒体信息的应用越来越广泛。以前图书馆里收藏的资料绝大多数都是纯粹的文本书籍,现在则有了多媒体图书馆,里面收藏的资料包括图像﹑视频和音频。建立多媒体图书馆的一个重要步骤是为海量的多媒体资料建立索引,以便用户进行高效率的检索。 随着在多媒体数据制造、存储与传播方面取得的重大技术进步,数字视频在各个领域的应用也越来越广泛,已经成为大多数人日常生活中经常遇到的一部分,能够从大量的视频资料中找到想要的信息成为人们迫切的要求。数字图像和视频也是数字图书馆计划中的核心内容。为了构建数字图书馆,要求将各种信息数字化,以便存储,检索和操作。如何管理和检索海量的视频数据已经成为近10 年来全球学术界和工业界一个富有挑战性的热门话题之一。近年来对视频检索系统的构建已经有了一些研究。有的系统是基于低层特性的,如视频中对象的形状﹑区域的亮度﹑颜色﹑纹理﹑人物动作描述﹑声音特征,有的系统是基于高层特征的,如人脸检测﹑说话人识别﹑文本识别。其中从视频中提取文本信息是比较受关注的一项,也是建立索引的一个重要的来源。 文本是视频中重要的内容信息。视频中文本的检测和识别在视频分析过程中起到很大的作用。文本可以作为视频片断的内容标识和索引,例如在新闻视频中出现的新闻摘要,可以作为该段新闻内容的描述,用于新闻视频资料的检索;文字可以作为视频分段的依据,例如播音员名字或演员表出现的地方,可以作为新闻视频的开始或影片的结束;文字可以作为视频内容重要程度的判断依据,例如出现醒目文字的帧,可以抽取出来作为对应的视频片断的代表帧,或者在生成视频摘要的过程中,出现醒目文字的部分,可以截取下来作为视频摘要的一部分。所以对文字的分析和处理是视频分析的重要内容。而检测视频中文字的出现及其准确位置,并将文字从复杂多变的背景中分割出来,是视频文字分析处理的基础。 在视频中提取和识别文字,可以有许多应用:从视频中提取出来的文本可以作为它们的索引和注释。例如对于一个关于篮球比赛的视频,可以提取视频中球员衣服上的球衣号码、球员姓名、球队名字作为注释和索引。这和建立视频中基于其他内容的索引相比,如对象的形状,计算代价要小得多。又如商业中,多媒体文档的手工登记工作要消耗大量的人力。如果能够自动读取商业多媒体档案中的特定文本信息,那就可以节约不少人力资源。 同扫描出来的文件图像中的文字的检测与识别相比,视频中的文字的检测与识别需要不同的方法。因为前者一般具有单一的文字颜色和背景颜色,只需要一个简单的阈值就可以将文字与背景分开。而视频图像中往往有多种噪声成分,文字的背景大多处于运动状态,字与背景的颜色也经常不单一,分辨率也比较低,
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP391.41

【引证文献】
中国期刊全文数据库 前1条
1 谭丽娜;李金屏;;基于视频帧重要区域相似性的镜头切换检测[J];济南大学学报(自然科学版);2009年01期
中国博士学位论文全文数据库 前1条
1 王振;数字视频中文本的提取方法研究[D];中国海洋大学;2011年
中国硕士学位论文全文数据库 前5条
1 刘凯;电视图像中的字幕检测算法[D];华南理工大学;2010年
2 李方翔;视频文字提取技术研究与应用[D];电子科技大学;2010年
3 高华;基于边缘和灰度的视频文字提取方法的研究与应用[D];北方工业大学;2011年
4 陈威;基于字符切分和无监督聚类的视频字幕提取方法[D];北京邮电大学;2011年
5 赵永志;彩色图像和视频中的文本提取算法研究[D];西北工业大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 张佑生,彭青松,汪荣贵;一种基于变异灰度直方图的视频字幕检测定位方法[J];电子学报;2004年02期
2 李朝晖,余英林,张为,邹艳碧;小波-神经网络在视频文本自动检测中的应用[J];广州大学学报(综合版);2001年05期
3 高健,何南忠,王以治;三峡右岸拌和楼汽车牌号图像识别系统[J];华中理工大学学报;1998年05期
4 曲晓慧,安钢;数据融合方法综述及展望[J];舰船电子工程;2003年02期
5 朱兴全,薛向阳,吴立德;一种自动门限选取的视频Shot分割方法[J];计算机研究与发展;2000年01期
6 冯慧君;基于小波变换和神经网络的视频文字检测[J];九江师专学报;2002年06期
7 胡宏斌,徐骏,周洞汝;基于COM技术的视频流文字检测[J];计算机工程;2001年06期
8 李朝晖,王秀峰;影视字幕文字识别的研究[J];计算机工程;2002年03期
9 黄晓东,周源华;用小波变换及颜色聚类提取的视频图像内中文字幕[J];计算机工程;2003年01期
10 马小勇,谢萍,张宪民;视频帧中提取文字区域的算法[J];计算机工程;2003年09期
【共引文献】
中国期刊全文数据库 前10条
1 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
2 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
3 程伟;张燕平;赵姝;;支持向量机在粮食产量预测中的应用[J];安徽农业科学;2009年08期
4 武素华;;基于最小二乘支持向量机的土壤含水量检测的研究与分析[J];安徽农业科学;2009年09期
5 陈念;沈佐民;;基于化学成分检测和SVM分类的茶叶品质鉴定[J];安徽农业科学;2010年15期
6 黄远顺;;矫直机的自动故障预报技术[J];安徽冶金;2012年01期
7 林春丽;齐欣;王克成;;SVM-KNN分类器在异常行为检测中的应用[J];辽宁科技大学学报;2010年05期
8 王亮;胡静涛;;基于LS-SVM的光刻过程R2R预测控制方法[J];半导体技术;2012年06期
9 刘典;刘文萍;;一种基于直方图的切变镜头自动检测算法[J];北方工业大学学报;2007年03期
10 张晓东;傅建平;张培林;;基于BP神经网络的火炮反后坐装置故障诊断[J];兵工自动化;2006年08期
中国重要会议论文全文数据库 前10条
1 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
2 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
3 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
5 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
6 吴静珠;刘翠玲;孙晓容;;支持向量机在近红外光谱检测技术中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
7 尹钟;张建华;;基于支持向量机方法的过程操作员功能状态分类[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 杨坤;纪志成;;基于峰值识别的改进SVM用电需求预测[A];中国自动化学会控制理论专业委员会B卷[C];2011年
9 晋朝勃;胡刚强;史广智;李玉阳;;一种采用支持向量机的水中目标识别方法[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
10 郭玮;李智勇;朱晟;孙慧;;支持向量机在变压器油溶解气体检测中的应用[A];第一届电力安全论坛优秀论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
2 朱广平;混响干扰中的信号检测技术研究[D];哈尔滨工程大学;2009年
3 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
4 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
5 黄伟国;基于振动信号特征提取与表达的旋转机械状态监测与故障诊断研究[D];中国科学技术大学;2010年
6 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
7 李先锋;基于特征优化和多特征融合的杂草识别方法研究[D];江苏大学;2010年
8 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
9 汪春梅;癫痫脑电信号特征提取与自动检测方法研究[D];华东理工大学;2011年
10 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 展慧;基于多源信息融合技术的板栗分级检测方法研究[D];华中农业大学;2010年
2 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
3 谌业滨;无线传感器网络自身健康状态融合机制研究[D];南昌航空大学;2010年
4 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
5 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
6 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
7 姜念;区间自适应粒子群算法研究及其应用[D];郑州大学;2010年
8 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
9 辛保兵;既有预应力混凝土梁桥剩余承载力评估方法研究[D];郑州大学;2010年
10 王巧立;微生物发酵过程的建模与优化控制研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 陈文婷;李磊;杨盈昀;;卡拉OK字幕的检测与定位[J];中国传媒大学学报(自然科学版);2008年02期
2 杨文杰,马昆,刘浩学;文字图像边界检测和去噪处理[J];北京印刷学院学报;2000年03期
3 李磊;王越超;姚娱;;神经网络BP算法模拟函数曲线的改进[J];东北电力大学学报;2006年06期
4 董立菊,于戈;一种有效的图像二值化方法[J];东北大学学报;2004年12期
5 章东平;徐志江;;一种基于稳健匹配准则的视频文本跟踪方法[J];电路与系统学报;2007年05期
6 李默,李弼程,苏大伟;新闻视频中标题条检测及文字内容提取算法[J];电视技术;2005年S1期
7 王学文,丁晓青,刘长松;基于Gabor变换的高鲁棒汉字识别新方法[J];电子学报;2002年09期
8 朱庆;吴波;万能;徐志祥;田一翔;;具有良好重复率与信息量的立体影像点特征提取方法[J];电子学报;2006年02期
9 田破荒;彭天强;李弼程;;基于文字穿越线和笔画连通性的视频文字提取方法[J];电子学报;2009年01期
10 陶志勇;孙劲光;任晓奎;;图像/视频字符区域定位算法的实现[J];辽宁工程技术大学学报;2004年S1期
中国博士学位论文全文数据库 前3条
1 章东平;视频文本的提取[D];浙江大学;2006年
2 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年
3 冀中;基于多模态信息的新闻视频内容分析技术研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘倩;基于彩色图像的文本区域提取研究[D];西南交通大学;2003年
2 唐跃林;基于MPEG视频的镜头检测系统[D];重庆大学;2004年
3 李明;复杂背景下的文本定位与提取研究[D];合肥工业大学;2004年
4 史阳;基于特征窗跟踪的视频稳像和镜头检测算法研究[D];西安电子科技大学;2005年
5 詹耀文;图像和视频中叠加文字提取算法研究及应用[D];中国科学院研究生院(计算技术研究所);2006年
6 陈艳;基于灰度图像的字符切分技术的研究[D];中国科学院研究生院(计算技术研究所);2004年
7 陆兵;视频中的文本提取及其应用[D];河海大学;2007年
8 居红云;无监督聚类算法和支持向量机及其应用研究[D];江南大学;2008年
9 时阳;新闻视频中文本检测和定位技术的研究[D];北京邮电大学;2009年
10 杨雅琴;视频字幕识别结果校对方法的研究与实现[D];北京邮电大学;2009年
【二级引证文献】
中国期刊全文数据库 前2条
1 曾凡锋;张国锋;陈侃;;中文文本图像倒置快速检测算法[J];计算机工程与设计;2012年09期
2 刘亚洲;刘国荣;王田甲;;基于Harris角点的彩色图像文字检测[J];微电子学与计算机;2010年10期
中国硕士学位论文全文数据库 前6条
1 昝蕊;数字视频中字幕的检测与提取[D];长春工业大学;2010年
2 廖佳;网络图片中文本区域的定位技术研究[D];四川师范大学;2011年
3 尹璐;基于MPEG足球视频场景切换检索的研究[D];北京邮电大学;2010年
4 李佳新;复杂背景下的视频文本定位与分割[D];西安科技大学;2012年
5 张国锋;基于文字检测的背景过滤技术的研究与应用[D];北方工业大学;2013年
6 张凯歌;基于K-means和神经网络算法的图像文字提取与识别[D];云南大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 王璇,李春升,周荫清;多传感器信息融合技术[J];北京航空航天大学学报;1994年04期
2 陈松灿,伍艳莲;图像的模糊识别方法研究与实现[J];电子学报;2000年11期
3 陈哲,冯天瑾;小波分析与神经网络结合的研究进展[J];电子科学学刊;2000年03期
4 叶芗芸,戚飞虎,蒋隽;基于选择性多分辨率Kohonen网络的自适应灰度图像分割方法[J];红外与毫米波学报;1998年01期
5 陆正刚,杨杰;模糊逻辑及其在数据融合中的应用[J];红外与激光工程;2000年05期
6 庄越挺,刘骏伟,吴飞,潘云鹤,张引;基于支持向量机的视频字幕自动定位与提取[J];计算机辅助设计与图形学学报;2002年08期
7 卢增祥,李衍达;交互支持向量机学习算法及其应用[J];清华大学学报(自然科学版);1999年07期
8 刘莹,刘三阳,马建峰;基于遗传算法的多传感器数据融合[J];微电子学与计算机;1999年02期
9 林明星,付晨钟;基于神经网络的多传感器信息融合技术[J];新技术新工艺;1999年03期
10 王辰,老松杨,胡晓峰;视频中的文字探测[J];小型微型计算机系统;2002年04期
【相似文献】
中国期刊全文数据库 前10条
1 刘芳;汪玉凯;;文本图像水印在电子政务中的应用研究[J];信息技术;2010年10期
2 蒋斌;平西建;张涛;;基于模式分析的二值文本图像隐写分析算法[J];计算机工程;2009年08期
3 贺志明;;不均匀光照文本图像的二值化[J];上海工程技术大学学报;2011年02期
4 蒋斌;平西建;;二值文本图像隐写分析算法[J];计算机工程与应用;2009年22期
5 刘坤;吕学强;王涛;施水才;;基于多尺度条件随机场的文本图像二值化[J];现代图书情报技术;2009年04期
6 张明;夏铭;;一种改进的文本图像二值化算法[J];科技信息;2009年27期
7 皮海兵;;图像文化:网络文化的实质[J];广西师范大学学报(哲学社会科学版);2010年06期
8 庄军,李弼程,陈刚;一种有效的文本图像二值化方法[J];微计算机信息;2005年08期
9 庄军;李弼程;;一种基于灰度共生矩阵的文本图像识别方法[J];计算机工程;2006年03期
10 韩文文;王玲;陈优广;;基于亚像素文本图像的分割算法[J];华东师范大学学报(自然科学版);2007年03期
中国重要会议论文全文数据库 前5条
1 张媛;蔡利栋;;一种去除文本图像椒盐噪声的方法[A];图像图形技术研究与应用(2010)[C];2010年
2 田艳艳;李大湘;齐敏;彭进业;;一种改进的彩色图像图文分割方法[A];全国第一届信号处理学术会议暨中国高科技产业化研究会信号处理分会筹备工作委员会第三次工作会议专刊[C];2007年
3 王四平;朱薇薇;刘志文;;一种新的斜体印刷字倾斜角度检测算法[A];全国第一届信号处理学术会议暨中国高科技产业化研究会信号处理分会筹备工作委员会第三次工作会议专刊[C];2007年
4 蒋勇;陈晓静;;一种多方向手写文本行提取方法[A];第二十七届中国控制会议论文集[C];2008年
5 古扎丽努尔·艾木肉拉;艾斯卡尔·艾木都拉;买买提江·吐尔逊;;维吾尔文笔迹图像预处理及特征提取方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国重要报纸全文数据库 前6条
1 四川 冯小民;做一个MSN贴图高手[N];电脑报;2002年
2 特约撰稿人 郑优军 甄浩;文稿输入让键盘走开[N];电脑报;2001年
3 诸艳;轻松在线OCR[N];中国电脑教育报;2004年
4 李荣兴;玩转数码相机[N];中国电脑教育报;2002年
5 ;认识自动OCR技术[N];计算机世界;2000年
6 李晓薇;“宽界”体验在粤掀起投影宽屏热潮[N];中国高新技术产业导报;2011年
中国博士学位论文全文数据库 前9条
1 谭利娜;文本图像鲁棒认证技术研究[D];湖南大学;2012年
2 尹芳;场景文本识别关键技术研究[D];哈尔滨理工大学;2012年
3 孙日明;几种图形图像压缩方法[D];大连理工大学;2013年
4 徐迎晖;文本载体信息隐藏技术研究[D];北京邮电大学;2006年
5 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
6 吴锐;自然场景中文本识别技术研究及实现[D];哈尔滨工业大学;2010年
7 王艳;图像分割的偏微分方程研究[D];重庆大学;2012年
8 程艳芬;离线阿拉伯手写体光学文字识别方法的研究[D];武汉理工大学;2009年
9 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 杜敏;文本图像认证技术研究[D];西北大学;2010年
2 黄细妹;基于决策树算法的文本图像分类方法研究[D];江西理工大学;2012年
3 张磊;文本图像信息隐藏技术研究[D];解放军信息工程大学;2009年
4 王绪;文本图像处理与表格图像识别算法研究[D];解放军信息工程大学;2010年
5 郭龙;印刷体文本图像文种识别技术研究[D];解放军信息工程大学;2011年
6 朱其猛;基于文字结构特征的文本图像方向的研究与应用[D];北方工业大学;2014年
7 顾立娟;基于文本图像纹理特征的文种识别技术研究[D];解放军信息工程大学;2009年
8 高艳云;基于文本图像的去噪算法的研究与应用[D];北方工业大学;2012年
9 吴飞飞;文本图像倾斜校正算法的研究与应用[D];北方工业大学;2014年
10 付亚南;光照不均文本图像的校正算法研究与应用[D];北方工业大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026