收藏本站
《浙江大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

视频文本的提取

章东平  
【摘要】:视频中的文本能够给视频检索和索引提供重要的辅助信息,有时视频中的文本包含了其它地方没有的信息,例如电影片头的字幕,有时,视频中的文本是一种重要而简洁的辅助信息,例如体育比赛中的得分股票价格。如果视频中的文本能够被有效地提取和识别,那么许多高层次的应用,例如视频摘要,就可以更好地实现。 论文对视频文本提取的几个方面,包括文本定位、文本跟踪、文本增强和文本分割进行了研究。与文档图像相比较,视频中的文本提取由于其较低的分辨率、复杂的背景、照明的变化、和位置、形状与颜色的不确定而具有很大的挑战性。 本文采用了一种压缩域与空域相结合的文本行定位方法,文本区域使用DCT块的纹理能量直接在DCT域检测,文本行根据文本区域差分图像的水平投影轮廓线来提取。 提出了一种基于M估计模板匹配的文本跟踪方法,匹配模板用LLT(Logical Level Technique)对文本区域进行粗分割得到,搜索窗口位置用MPEG-2比特流中的运动向量来估计,模板匹配的加速采用基于优胜者更新的多分辨率方法。 一种多帧融合的增强方法被用来提高文本与背景的对比度,论文根据文本区域中每个象素在时间域上的强度分布决定采用多帧平均方法还是采用多帧最小或多帧最大方法来增强文本区域。 提出了一种基于彩色笔画模型的文本分割算法,彩色笔画模型描述了字符在彩色空间的局部地形学特征,文本分割算法由文本区域二值化和连通区域二部分组成。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP391.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 杨高波;吴潇;张兆扬;朱宁波;;基于过渡像素的视频图像文本检测与定位[J];湖南大学学报(自然科学版);2011年06期
2 夏小玲;肖宇嵬;柴大萍;;一种基于内容的镜头边界快速检测方法[J];东华大学学报(自然科学版);2011年03期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前8条
1 沈庆华;李树涛;李怡;;基于小波变换和形态学的复杂背景文本定位[A];第二十六届中国控制会议论文集[C];2007年
2 胡芊;杨正球;;基于去噪声的视频图像中的字幕提取[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 钟辉;黄洋;;基于版面特征的文档图像的文本定位方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
4 蔡骋;林健文;谈正;;面向视频检索的自适应最优阿而发裁减均值直方图[A];第十三届全国图象图形学学术会议论文集[C];2006年
5 原琨;姚鸿勋;纪荣嵘;;基于时空关联的角色关系挖掘[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
6 蔡骋;谈正;;针对快速视频检索的DCT域内基于高斯模型的视频镜头内容代表[A];第十二届全国图象图形学学术会议论文集[C];2005年
7 杨震群;魏骁勇;夏芳;;基于上下文空间的概念融合技术[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
8 潘丽娜;陆伟;周国飞;;广西气象影视视频数据库建模分析[A];2008年广西气象学会学术年会论文集[C];2008年
中国重要报纸全文数据库 前4条
1 匡铟;e-Learning的角色[N];中国计算机报;2003年
2 ;感受恒生蓝色梦幻91000[N];电脑报;2001年
3 记者 傅一览;充满信心全力推进西湖申遗[N];杭州日报;2010年
4 谢文砚;软件优化将更重要[N];中国计算机报;2004年
中国博士学位论文全文数据库 前7条
1 章东平;视频文本的提取[D];浙江大学;2006年
2 李朝晖;基于视频文本检测和视频对象分割方法研究[D];华南理工大学;2004年
3 陈添丁;基于内容特征的图像检索和整合性视频检索[D];浙江大学;2003年
4 宋彦;视频语义标注方法和理论的研究[D];中国科学技术大学;2006年
5 孙巧榆;复杂背景图像的文本信息提取研究[D];华东师范大学;2012年
6 何云峰;视频内容组织与索引技术研究[D];华中科技大学;2011年
7 雷少帅;基于内容的视频检索关键技术研究[D];太原理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈森;自然场景图像中的文本定位方法及应用研究[D];华南理工大学;2011年
2 李佳新;复杂背景下的视频文本定位与分割[D];西安科技大学;2012年
3 汪文芳;基于移动终端的自然场景文本定位和识别[D];西安电子科技大学;2011年
4 吴智恺;基于笔画特征的多方法综合视频文本提取算法研究[D];上海交通大学;2010年
5 陈蔚;基于内容的图像检索技术在数字化学习资源中的应用研究[D];西南大学;2008年
6 陈庆民;图像文本提取系统设计及应用研究[D];上海交通大学;2012年
7 孟天;自然场景下的文本定位[D];西安电子科技大学;2007年
8 白晶;复杂背景图像中的文本定位方法研究[D];哈尔滨工程大学;2009年
9 赵超;视频检索中字幕文本的提取研究[D];上海交通大学;2009年
10 吴静轩;基于内容的视频快速索引[D];上海交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026