收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

数字视频中文本的提取方法研究

王振  
【摘要】:对于视频内容的分析与检索已成为当前视频信息研究领域的一个热点。由于视频中包含的文字信息与视频内容关系密切,可以为视频内容理解与检索提供重要线索,因此如何快速、准确的提取视频中文本信息也就成为一项非常有意义的研究方向。除此以外,视频文本提取技术通过与各种移动数码设备(数码摄像机、数码相机、PDA、手机等)结合,在自动翻译、盲人导航、机器人视觉、智能交通等方面也发挥了越来越大的作用,并逐渐成为了研究人员关注的热点问题。 从视频中提取文本信息并不是一件简单的事情,由于视频图像中的文本往往存在于复杂的背景中,同一幅图像中可能含有不同字体、颜色、大小和排列方式的文字,因此对于视频中文本检测、定位和分割具有很大的难度。 本文对于视频文本提取框架中的若干关键问题,如文本定位﹑跟踪﹑增强以及实际应用(新闻故事自动分割、道路交通标识牌文字识别系统)开展研究。研究内容主要如下: 提出了一种综合灰度形态学和小波多尺度分解与重构算法的文本定位方法。首先结合形态学与小波分析在边缘检测方面的优点,提取出视频帧边缘像素,然后通过“基于密度”的区域增长算法将边缘像素合并成为候选文本区。最后采用基于BPSO算法进行特征选择及SVM参数同步优化的分类器对候选文本区进行确认。本方法有效克服了单独优化特征或单独优化分类器参数的缺陷,取得较好的分类效果。 提出一种基于边缘角点与改进Hausdorff距离为判定准则的静止和线性运动文本的跟踪算法。首先将边缘算子提取的二值图像经去噪、细化处理后,以提取的边缘角点为特征点集合,用改进的Hausdorff距离度量为判定准则,通过点模式匹配法跟踪文本区域在相邻视频帧序列中的位置。实验结果显示,点模式匹配的跟踪算法比图像整体像素匹配的算法跟踪精度更高。由于该算法不必对每个视频帧都进行文本定位,从而大大提高了系统效率。在文本跟踪的基础上,用基于多帧融合思想的前景/背景识别算法提取视频文字笔画并作OCR识别。 提出了一种融合视频中的标题字幕信息以及音、视频等多模态信息的新闻故事单元分割方法,并实现了一个新闻故事分割、浏览和检索的原型系统。首先根据第二、三章的算法实现对新闻标题文本的定位、跟踪与分割,并在镜头分割的基础上,根据混合高斯模型(GMM)与KL差异法完成播音员和非播音员音频镜头的识别,最后结合新闻视频节目的特殊结构知识完成对新闻节目故事单元的自动分割。 介绍了一种视频文本提取算法在辅助驾驶系统中的应用,通过对道路标识牌上的文字提取,从而提供给驾驶员在公路上的导航,如所处位置、方向、限速等信息。算法首先基于颜色信息来定位特定颜色的道路标识牌,然后经过仿射变换,基于笔画算子的种子区域增长算法进行交通标识牌文字的定位、分割和提取。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘芳;汪玉凯;;文本图像水印在电子政务中的应用研究[J];信息技术;2010年10期
2 蒋斌;平西建;张涛;;基于模式分析的二值文本图像隐写分析算法[J];计算机工程;2009年08期
3 贺志明;;不均匀光照文本图像的二值化[J];上海工程技术大学学报;2011年02期
4 蒋斌;平西建;;二值文本图像隐写分析算法[J];计算机工程与应用;2009年22期
5 刘坤;吕学强;王涛;施水才;;基于多尺度条件随机场的文本图像二值化[J];现代图书情报技术;2009年04期
6 张明;夏铭;;一种改进的文本图像二值化算法[J];科技信息;2009年27期
7 皮海兵;;图像文化:网络文化的实质[J];广西师范大学学报(哲学社会科学版);2010年06期
8 庄军,李弼程,陈刚;一种有效的文本图像二值化方法[J];微计算机信息;2005年08期
9 庄军;李弼程;;一种基于灰度共生矩阵的文本图像识别方法[J];计算机工程;2006年03期
10 韩文文;王玲;陈优广;;基于亚像素文本图像的分割算法[J];华东师范大学学报(自然科学版);2007年03期
11 刘仁金;高远飙;郝祥根;;文本图像页面分割算法研究[J];中国科学技术大学学报;2010年05期
12 杨洋;平西建;;复杂版面的文本图像图文分割算法[J];微计算机信息;2006年13期
13 贺志明;;数码相机拍摄的文本图像的二值化[J];上海工程技术大学学报;2006年03期
14 赵星阳;孙继银;;一种可抗二值化攻击的文本图像可见水印算法[J];计算机应用;2009年01期
15 张媛;蔡利栋;;一种去除文本图像椒盐噪声的方法[J];长春理工大学学报(自然科学版);2010年02期
16 郭龙;平西建;周林;童莉;;基本图像特征用于文本图像文种识别[J];应用科学学报;2011年01期
17 郭龙;平西建;周林;;基于文字笔画方向直方图的文本图像文种识别[J];信息工程大学学报;2011年02期
18 顾立娟;刘才斌;吴勇;郝玉保;;基于多小波变换的文本图像文种识别[J];电子设计工程;2011年15期
19 王加俊,黄贤武,郭玮玮,仲兴荣;文本页面图像的图文分割与分类算法[J];中国图象图形学报;2004年05期
20 董湘君,常鸿森,郑楚君;一种基于小波变换的文本图像阈值法分割[J];华南师范大学学报(自然科学版);2004年03期
中国重要会议论文全文数据库 前5条
1 张媛;蔡利栋;;一种去除文本图像椒盐噪声的方法[A];图像图形技术研究与应用(2010)[C];2010年
2 田艳艳;李大湘;齐敏;彭进业;;一种改进的彩色图像图文分割方法[A];全国第一届信号处理学术会议暨中国高科技产业化研究会信号处理分会筹备工作委员会第三次工作会议专刊[C];2007年
3 王四平;朱薇薇;刘志文;;一种新的斜体印刷字倾斜角度检测算法[A];全国第一届信号处理学术会议暨中国高科技产业化研究会信号处理分会筹备工作委员会第三次工作会议专刊[C];2007年
4 蒋勇;陈晓静;;一种多方向手写文本行提取方法[A];第二十七届中国控制会议论文集[C];2008年
5 古扎丽努尔·艾木肉拉;艾斯卡尔·艾木都拉;买买提江·吐尔逊;;维吾尔文笔迹图像预处理及特征提取方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国博士学位论文全文数据库 前9条
1 谭利娜;文本图像鲁棒认证技术研究[D];湖南大学;2012年
2 尹芳;场景文本识别关键技术研究[D];哈尔滨理工大学;2012年
3 孙日明;几种图形图像压缩方法[D];大连理工大学;2013年
4 徐迎晖;文本载体信息隐藏技术研究[D];北京邮电大学;2006年
5 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
6 吴锐;自然场景中文本识别技术研究及实现[D];哈尔滨工业大学;2010年
7 王艳;图像分割的偏微分方程研究[D];重庆大学;2012年
8 程艳芬;离线阿拉伯手写体光学文字识别方法的研究[D];武汉理工大学;2009年
9 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 杜敏;文本图像认证技术研究[D];西北大学;2010年
2 黄细妹;基于决策树算法的文本图像分类方法研究[D];江西理工大学;2012年
3 张磊;文本图像信息隐藏技术研究[D];解放军信息工程大学;2009年
4 王绪;文本图像处理与表格图像识别算法研究[D];解放军信息工程大学;2010年
5 郭龙;印刷体文本图像文种识别技术研究[D];解放军信息工程大学;2011年
6 朱其猛;基于文字结构特征的文本图像方向的研究与应用[D];北方工业大学;2014年
7 顾立娟;基于文本图像纹理特征的文种识别技术研究[D];解放军信息工程大学;2009年
8 高艳云;基于文本图像的去噪算法的研究与应用[D];北方工业大学;2012年
9 吴飞飞;文本图像倾斜校正算法的研究与应用[D];北方工业大学;2014年
10 付亚南;光照不均文本图像的校正算法研究与应用[D];北方工业大学;2014年
中国重要报纸全文数据库 前6条
1 四川 冯小民;做一个MSN贴图高手[N];电脑报;2002年
2 特约撰稿人 郑优军 甄浩;文稿输入让键盘走开[N];电脑报;2001年
3 诸艳;轻松在线OCR[N];中国电脑教育报;2004年
4 李荣兴;玩转数码相机[N];中国电脑教育报;2002年
5 ;认识自动OCR技术[N];计算机世界;2000年
6 李晓薇;“宽界”体验在粤掀起投影宽屏热潮[N];中国高新技术产业导报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978