收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

数字视频中的文本分割的研究

许剑峰  
【摘要】:如今多媒体信息的应用越来越广泛。以前图书馆里收藏的资料绝大多数都是纯粹的文本书籍,现在则有了多媒体图书馆,里面收藏的资料包括图像﹑视频和音频。建立多媒体图书馆的一个重要步骤是为海量的多媒体资料建立索引,以便用户进行高效率的检索。 随着在多媒体数据制造、存储与传播方面取得的重大技术进步,数字视频在各个领域的应用也越来越广泛,已经成为大多数人日常生活中经常遇到的一部分,能够从大量的视频资料中找到想要的信息成为人们迫切的要求。数字图像和视频也是数字图书馆计划中的核心内容。为了构建数字图书馆,要求将各种信息数字化,以便存储,检索和操作。如何管理和检索海量的视频数据已经成为近10 年来全球学术界和工业界一个富有挑战性的热门话题之一。近年来对视频检索系统的构建已经有了一些研究。有的系统是基于低层特性的,如视频中对象的形状﹑区域的亮度﹑颜色﹑纹理﹑人物动作描述﹑声音特征,有的系统是基于高层特征的,如人脸检测﹑说话人识别﹑文本识别。其中从视频中提取文本信息是比较受关注的一项,也是建立索引的一个重要的来源。 文本是视频中重要的内容信息。视频中文本的检测和识别在视频分析过程中起到很大的作用。文本可以作为视频片断的内容标识和索引,例如在新闻视频中出现的新闻摘要,可以作为该段新闻内容的描述,用于新闻视频资料的检索;文字可以作为视频分段的依据,例如播音员名字或演员表出现的地方,可以作为新闻视频的开始或影片的结束;文字可以作为视频内容重要程度的判断依据,例如出现醒目文字的帧,可以抽取出来作为对应的视频片断的代表帧,或者在生成视频摘要的过程中,出现醒目文字的部分,可以截取下来作为视频摘要的一部分。所以对文字的分析和处理是视频分析的重要内容。而检测视频中文字的出现及其准确位置,并将文字从复杂多变的背景中分割出来,是视频文字分析处理的基础。 在视频中提取和识别文字,可以有许多应用:从视频中提取出来的文本可以作为它们的索引和注释。例如对于一个关于篮球比赛的视频,可以提取视频中球员衣服上的球衣号码、球员姓名、球队名字作为注释和索引。这和建立视频中基于其他内容的索引相比,如对象的形状,计算代价要小得多。又如商业中,多媒体文档的手工登记工作要消耗大量的人力。如果能够自动读取商业多媒体档案中的特定文本信息,那就可以节约不少人力资源。 同扫描出来的文件图像中的文字的检测与识别相比,视频中的文字的检测与识别需要不同的方法。因为前者一般具有单一的文字颜色和背景颜色,只需要一个简单的阈值就可以将文字与背景分开。而视频图像中往往有多种噪声成分,文字的背景大多处于运动状态,字与背景的颜色也经常不单一,分辨率也比较低,


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘芳;汪玉凯;;文本图像水印在电子政务中的应用研究[J];信息技术;2010年10期
2 蒋斌;平西建;张涛;;基于模式分析的二值文本图像隐写分析算法[J];计算机工程;2009年08期
3 贺志明;;不均匀光照文本图像的二值化[J];上海工程技术大学学报;2011年02期
4 蒋斌;平西建;;二值文本图像隐写分析算法[J];计算机工程与应用;2009年22期
5 刘坤;吕学强;王涛;施水才;;基于多尺度条件随机场的文本图像二值化[J];现代图书情报技术;2009年04期
6 张明;夏铭;;一种改进的文本图像二值化算法[J];科技信息;2009年27期
7 皮海兵;;图像文化:网络文化的实质[J];广西师范大学学报(哲学社会科学版);2010年06期
8 庄军,李弼程,陈刚;一种有效的文本图像二值化方法[J];微计算机信息;2005年08期
9 庄军;李弼程;;一种基于灰度共生矩阵的文本图像识别方法[J];计算机工程;2006年03期
10 韩文文;王玲;陈优广;;基于亚像素文本图像的分割算法[J];华东师范大学学报(自然科学版);2007年03期
11 刘仁金;高远飙;郝祥根;;文本图像页面分割算法研究[J];中国科学技术大学学报;2010年05期
12 杨洋;平西建;;复杂版面的文本图像图文分割算法[J];微计算机信息;2006年13期
13 贺志明;;数码相机拍摄的文本图像的二值化[J];上海工程技术大学学报;2006年03期
14 赵星阳;孙继银;;一种可抗二值化攻击的文本图像可见水印算法[J];计算机应用;2009年01期
15 张媛;蔡利栋;;一种去除文本图像椒盐噪声的方法[J];长春理工大学学报(自然科学版);2010年02期
16 郭龙;平西建;周林;童莉;;基本图像特征用于文本图像文种识别[J];应用科学学报;2011年01期
17 郭龙;平西建;周林;;基于文字笔画方向直方图的文本图像文种识别[J];信息工程大学学报;2011年02期
18 顾立娟;刘才斌;吴勇;郝玉保;;基于多小波变换的文本图像文种识别[J];电子设计工程;2011年15期
19 王加俊,黄贤武,郭玮玮,仲兴荣;文本页面图像的图文分割与分类算法[J];中国图象图形学报;2004年05期
20 董湘君,常鸿森,郑楚君;一种基于小波变换的文本图像阈值法分割[J];华南师范大学学报(自然科学版);2004年03期
中国重要会议论文全文数据库 前5条
1 张媛;蔡利栋;;一种去除文本图像椒盐噪声的方法[A];图像图形技术研究与应用(2010)[C];2010年
2 田艳艳;李大湘;齐敏;彭进业;;一种改进的彩色图像图文分割方法[A];全国第一届信号处理学术会议暨中国高科技产业化研究会信号处理分会筹备工作委员会第三次工作会议专刊[C];2007年
3 王四平;朱薇薇;刘志文;;一种新的斜体印刷字倾斜角度检测算法[A];全国第一届信号处理学术会议暨中国高科技产业化研究会信号处理分会筹备工作委员会第三次工作会议专刊[C];2007年
4 蒋勇;陈晓静;;一种多方向手写文本行提取方法[A];第二十七届中国控制会议论文集[C];2008年
5 古扎丽努尔·艾木肉拉;艾斯卡尔·艾木都拉;买买提江·吐尔逊;;维吾尔文笔迹图像预处理及特征提取方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国博士学位论文全文数据库 前9条
1 谭利娜;文本图像鲁棒认证技术研究[D];湖南大学;2012年
2 尹芳;场景文本识别关键技术研究[D];哈尔滨理工大学;2012年
3 孙日明;几种图形图像压缩方法[D];大连理工大学;2013年
4 徐迎晖;文本载体信息隐藏技术研究[D];北京邮电大学;2006年
5 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
6 吴锐;自然场景中文本识别技术研究及实现[D];哈尔滨工业大学;2010年
7 王艳;图像分割的偏微分方程研究[D];重庆大学;2012年
8 程艳芬;离线阿拉伯手写体光学文字识别方法的研究[D];武汉理工大学;2009年
9 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 杜敏;文本图像认证技术研究[D];西北大学;2010年
2 黄细妹;基于决策树算法的文本图像分类方法研究[D];江西理工大学;2012年
3 张磊;文本图像信息隐藏技术研究[D];解放军信息工程大学;2009年
4 王绪;文本图像处理与表格图像识别算法研究[D];解放军信息工程大学;2010年
5 郭龙;印刷体文本图像文种识别技术研究[D];解放军信息工程大学;2011年
6 朱其猛;基于文字结构特征的文本图像方向的研究与应用[D];北方工业大学;2014年
7 顾立娟;基于文本图像纹理特征的文种识别技术研究[D];解放军信息工程大学;2009年
8 高艳云;基于文本图像的去噪算法的研究与应用[D];北方工业大学;2012年
9 吴飞飞;文本图像倾斜校正算法的研究与应用[D];北方工业大学;2014年
10 付亚南;光照不均文本图像的校正算法研究与应用[D];北方工业大学;2014年
中国重要报纸全文数据库 前6条
1 四川 冯小民;做一个MSN贴图高手[N];电脑报;2002年
2 特约撰稿人 郑优军 甄浩;文稿输入让键盘走开[N];电脑报;2001年
3 诸艳;轻松在线OCR[N];中国电脑教育报;2004年
4 李荣兴;玩转数码相机[N];中国电脑教育报;2002年
5 ;认识自动OCR技术[N];计算机世界;2000年
6 李晓薇;“宽界”体验在粤掀起投影宽屏热潮[N];中国高新技术产业导报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978