收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

数字视频中的文本分割的研究

许剑峰  
【摘要】:如今多媒体信息的应用越来越广泛。以前图书馆里收藏的资料绝大多数都是纯粹的文本书籍,现在则有了多媒体图书馆,里面收藏的资料包括图像﹑视频和音频。建立多媒体图书馆的一个重要步骤是为海量的多媒体资料建立索引,以便用户进行高效率的检索。 随着在多媒体数据制造、存储与传播方面取得的重大技术进步,数字视频在各个领域的应用也越来越广泛,已经成为大多数人日常生活中经常遇到的一部分,能够从大量的视频资料中找到想要的信息成为人们迫切的要求。数字图像和视频也是数字图书馆计划中的核心内容。为了构建数字图书馆,要求将各种信息数字化,以便存储,检索和操作。如何管理和检索海量的视频数据已经成为近10 年来全球学术界和工业界一个富有挑战性的热门话题之一。近年来对视频检索系统的构建已经有了一些研究。有的系统是基于低层特性的,如视频中对象的形状﹑区域的亮度﹑颜色﹑纹理﹑人物动作描述﹑声音特征,有的系统是基于高层特征的,如人脸检测﹑说话人识别﹑文本识别。其中从视频中提取文本信息是比较受关注的一项,也是建立索引的一个重要的来源。 文本是视频中重要的内容信息。视频中文本的检测和识别在视频分析过程中起到很大的作用。文本可以作为视频片断的内容标识和索引,例如在新闻视频中出现的新闻摘要,可以作为该段新闻内容的描述,用于新闻视频资料的检索;文字可以作为视频分段的依据,例如播音员名字或演员表出现的地方,可以作为新闻视频的开始或影片的结束;文字可以作为视频内容重要程度的判断依据,例如出现醒目文字的帧,可以抽取出来作为对应的视频片断的代表帧,或者在生成视频摘要的过程中,出现醒目文字的部分,可以截取下来作为视频摘要的一部分。所以对文字的分析和处理是视频分析的重要内容。而检测视频中文字的出现及其准确位置,并将文字从复杂多变的背景中分割出来,是视频文字分析处理的基础。 在视频中提取和识别文字,可以有许多应用:从视频中提取出来的文本可以作为它们的索引和注释。例如对于一个关于篮球比赛的视频,可以提取视频中球员衣服上的球衣号码、球员姓名、球队名字作为注释和索引。这和建立视频中基于其他内容的索引相比,如对象的形状,计算代价要小得多。又如商业中,多媒体文档的手工登记工作要消耗大量的人力。如果能够自动读取商业多媒体档案中的特定文本信息,那就可以节约不少人力资源。 同扫描出来的文件图像中的文字的检测与识别相比,视频中的文字的检测与识别需要不同的方法。因为前者一般具有单一的文字颜色和背景颜色,只需要一个简单的阈值就可以将文字与背景分开。而视频图像中往往有多种噪声成分,文字的背景大多处于运动状态,字与背景的颜色也经常不单一,分辨率也比较低,


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙季丰,李颖雄;视频镜头自动分割的若干方法[J];华南理工大学学报(自然科学版);2003年08期
2 刘佳兵;;基于窗口最大值和自适应阈值的视频镜头分割算法[J];福建电脑;2007年08期
3 刘政凯,汤晓鸥;视频检索中镜头分割方法综述[J];计算机工程与应用;2002年23期
4 刘佳兵;;视频检索中的视频镜头分割技术[J];福建电脑;2007年01期
5 杨阿祧;吴卉男;;视频内容的结构分析研究[J];贵州师范大学学报(自然科学版);2007年04期
6 潘磊,束鑫;一种改进的视频镜头切变检测算法[J];电视技术;2004年08期
7 潘磊,吴小俊,尤媛媛;基于聚类的视频镜头分割和关键帧提取[J];红外与激光工程;2005年03期
8 张国权;李向伟;李战明;张明新;韦哲;;一种新的基于I帧的压缩域镜头分割算法[J];海南大学学报(自然科学版);2008年03期
9 郭智强;黄志华;;基于类间距离和准则的镜头分割[J];南京师范大学学报(工程技术版);2008年04期
10 王新舸;罗志强;;代表帧及其提取方法[J];电视技术;2010年10期
11 吕晓宇;;视频镜头分割方法[J];办公自动化;2011年02期
12 陶丹,申铉京;基于内容的图像检索系统的关键技术[J];北华大学学报(自然科学版);2004年01期
13 郭汉龙,陈福民,张敏芳;基于自动门限的分区直方图的镜头分割[J];计算机工程与科学;2005年08期
14 沈玉利;任建峰;郭雷;;基于决策树的MPEG视频镜头分割算法[J];计算机工程与应用;2006年12期
15 肖治民;林坤辉;周昌乐;林强;;基于HSV颜色空间的视频镜头检测[J];厦门大学学报(自然科学版);2008年05期
16 张振领;;基于内容的监视视频摘要技术研究[J];电脑知识与技术;2008年10期
17 李钢;段富;;彩色直方图镜头分割中的阈值研究[J];电脑开发与应用;2008年11期
18 吴一全;庞磊;;基于Contourlet域独立分量分析的视频水印[J];应用基础与工程科学学报;2009年06期
19 李玉芝;;视频检索技术概况[J];华章;2011年19期
20 杨友庆,高隽,鲍捷,杨学东;基于视频的字幕检索与提取[J];计算机应用;2000年10期
中国重要会议论文全文数据库 前10条
1 陈星;宋欣;贾春华;;基于内容检索中的视频镜头分割方法的比较[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
2 刘伟;龚隽鹏;张鹏洲;;基于非压缩域下视频的镜头切割算法的改进[A];中国新闻技术工作者联合会五届二次理事会暨学术年会论文集(上篇)[C];2010年
3 那幼超;刘冀伟;汪飞星;;基于自动镜头分割的H.264视频压缩编码[A];第十三届全国图象图形学学术会议论文集[C];2006年
4 张铁林;李周贤;王纯;贾克斌;;视频信息结构化处理与应用系统建立[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
5 李国辉;付畅俭;徐新文;冷智花;;NBA视频中关联规则挖掘[A];第四届和谐人机环境联合学术会议论文集[C];2008年
6 李远宁;刘汀;蒋树强;黄庆明;;基于“Bag of Words”的视频匹配方法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
7 徐忠强;;电视新闻节目基于内容的视频检索技术及其实现[A];2009中国电影电视技术学会影视技术文集[C];2010年
8 林健;夏靖波;;基于互传信息量的关键帧提取[A];2005中国控制与决策学术年会论文集(上)[C];2005年
9 文振焜;朱为总;欧阳杰;高金花;;一种鲁棒可区分的视频感知哈希算法[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
10 许江波;姜秀华;王玉霞;;基于内容的视觉信息检索系统[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
中国博士学位论文全文数据库 前10条
1 许剑峰;数字视频中的文本分割的研究[D];华南理工大学;2005年
2 章东平;视频文本的提取[D];浙江大学;2006年
3 李朝晖;基于视频文本检测和视频对象分割方法研究[D];华南理工大学;2004年
4 刘阳;数字电视的视频分析与组播传输[D];中国科学院研究生院(软件研究所);2003年
5 赵亚琴;基于内容的视频片段检索技术研究[D];南京理工大学;2007年
6 付畅俭;基于内容的视频结构挖掘方法研究[D];国防科学技术大学;2008年
7 李丽洁;视频中文本信息提取技术研究[D];哈尔滨工程大学;2012年
8 王伟强;融合多模式信息压缩域新闻视频解析技术研究[D];中国科学院研究生院(计算技术研究所);2001年
9 王振;数字视频中文本的提取方法研究[D];中国海洋大学;2011年
10 牛振兴;足球视频主题建模及内容分析方法研究[D];西安电子科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈晨;视频分析中的镜头分割和目标跟踪研究[D];南京理工大学;2012年
2 钟成军;足球视频高级语义分析[D];吉林大学;2012年
3 刘跟涛;基于内容的视频结构分析[D];北京邮电大学;2010年
4 师鸣若;基于内容的视频检索系统研究[D];西安理工大学;2003年
5 彭希君;基于内容的视频高效检索技术的研究[D];南京理工大学;2004年
6 刘飞;基于内容的视频检索的快速方法研究[D];四川大学;2005年
7 曹晋高;视频关键帧提取方法研究[D];重庆大学;2008年
8 陈攀;基于特征部位和肤色的不良视频检测的算法研究[D];华中师范大学;2011年
9 韩东;基于视频信息的新闻结构分析和口播镜头检测[D];四川大学;2006年
10 任晓峰;基于内容的视频检索算法研究[D];武汉理工大学;2008年
中国重要报纸全文数据库 前4条
1 吴思、杨春、王雁凌;掀起多媒体检索革命[N];中国计算机报;2002年
2 ;视频数据中挖“宝”[N];计算机世界;2002年
3 ;可搜索的视频:又一座金矿[N];网络世界;2010年
4 湖南 头重脚轻;玩转数码影片制作[N];电脑报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978