收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

视频中文本信息提取技术研究

李丽洁  
【摘要】:视频是一种综合图像、文本、声音多种模态信息的媒体数据,具有数据量大、信息丰富的特点。随着计算技术、多媒体处理技术、网络技术的发展,视频数据急剧膨胀,传统的基于人工标注的视频内容分析技术已经无法满足海量视频数据的管理和检索需求,人们希望计算机能实现视频内容的自动提取,随之基于内容的视频检索技术应运而生。然而视频文件具有非结构化的数据组织方式,是以像素的形式存储目标对象的颜色、亮度和位置等低层信息,缺乏对高层语义信息的直观描述,而且数据量巨大、表现内容多样,因此关于如何实现计算机自动从视频数据中提取高层语义内容的研究成为了视频数据的自动化、智能化管理和检索领域的热点。视频中的文本不仅与视频内容高度相关,为视频内容的自动理解提供了非常重要的线索,而且相比于其它信息更易于提取,因此实现视频中文本信息的自动提取识别对于基于内容的视频数据检索研究具有重要的意义。 实现视频中文本信息的自动提取并非易事,文本通常嵌在复杂的背景当中,即使在同一视频中,文本的语言、字体、颜色也表现多样化。本文针对视频中文本信息提取的关键技术进行了深入研究,包括视频图像中文本区域的检测、定位,连续多帧出现的同一文本区域的跟踪,以及文本字符的分割。 针对视频中文本的检测和定位问题,提出了一种融合小波特征和局部二值模式特征由粗检测到精确定位实现的视频文本检测定位的方法。首先结合边缘和角点在视频图像中完成潜在文本区域的检测,然后融合小波特征和局部二值模式特征描述纹理并运用基于流行学习的等距离映射法(Isometric mapping, ISOMAP)进行特征降维,最后采用支持向量机(Support Vector Machine, SVM)方法实现文本区域的精确分类并基于梯度密度图实现单个文本行的精确定位。算法通过多特征、多步骤实现视频中文本区域的检测和定位。 为了提高视频中文本区域检测定位的效率,提出一种基于模版匹配的视频文本区域跟踪算法。文本区域图像经小波重构所得的边缘图像作为匹配模版,利用基于相关性的归一化的互相关(Normalized Cross-correlation, NCC)测度作为模版匹配度量标准实现视频文本的跟踪,同时应用金字塔匹配策略进行分层次匹配。有效地利用视频中文本的时间冗余特性,实现快速高效的文本区域跟踪,可以避免在每一帧中都执行文本区域检测定位,加快整个视频文本信息提取的速度。 视频中的文本通常处于复杂背景当中,本文提出了一种基于多帧融合的视频文本分割算法。首先选择同一文本图像序列中背景简单的图像进行融合,极性判断后得到适合OCR软件的反对色文本图像。针对字符笔画结构多样性的特点,综合考虑字符的灰度特性和边缘特性,对传统的二维最大条件熵进行改进,将基于非降采样Contourlet变换(Non-subsampled Contourlet Transform, NSCT)的最大二维条件熵作为适应度评价函数,利用细菌觅食优化(Bacterial Foraging Optimization, BFO)算法高效的全局寻优能力计算图像分割的最佳阈值。算法有效地减少了复杂背景对文本分割的影响,提高了分割阈值的精确性和视频文本的识别率。 另外,本文还提出了一种基于脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)的视频文本分割算法。充分研究了PCNN在图像分割应用中的优良特性,针对视频文本分割具体应用,对简化的PCNN网络模型的参数和输出标准进行改进,在文本分割过程中,基于PCNN的方法不同于传统的阈值分割方法,能够有效地缩小灰度值相近的相邻像素的差别。本文的视频文本分割方法有效可行,对于复杂背景同样具有较强的鲁棒性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵超;方向忠;;基于文字混合特征的视频文本定位研究[J];微计算机信息;2009年18期
2 曾峰,刘长松,丁晓青;利用名片文本图像版面信息的辅助分类方法[J];电视技术;2004年08期
3 彭禾;浅谈DOS 7 EDIT_COM文本剪接功能[J];电脑编程技巧与维护;1996年08期
4 张升;中文Word97操作技巧[J];电脑学习;2000年05期
5 三月阳光;Flash MX设计中的快捷键技巧[J];电脑知识与技术;2003年31期
6 纪祥;刘华虓;吴芬芬;刘磊;;基于特征和HMM的信息提取[J];吉林大学学报(信息科学版);2009年04期
7 周源远,王继成,郑刚,张福炎;Web页面清洗技术的研究与实现[J];计算机工程;2002年09期
8 余健;中文Windows技术讲座[J];电脑知识与技术;1996年03期
9 常桂英;WORD使用技巧点滴[J];内蒙古科技与经济;2002年06期
10 胡德玉;问与答[J];桌面出版与设计;1998年05期
11 麻会东;刘国华;李旭;梁鹏;刘春辉;张凌宇;;基于提取关键词的中文文档复制检测研究[J];计算机工程与科学;2007年10期
12 邹永强;钟志农;;一种高效的新闻网页噪声过滤方法[J];微型机与应用;2011年16期
13 王爱胜;“文本信息加工”到底要加工什么[J];信息技术教育;2005年03期
14 李霞;视图中插入文本块的编程方法[J];广州大学学报(自然科学版);2002年04期
15 彭禾;浅谈DOS EDIT的文本块选择[J];电脑爱好者;1994年08期
16 陈冰;FreeHand 10使用技巧(四)[J];电脑技术;2002年04期
17 黄同城;丁友东;;基于高频小波系数分类器的图像文本信息的非监督检测[J];湖南农业大学学报(自然科学版);2006年02期
18 西贝;;巧选纵向Word文本[J];电脑校园;2002年11期
19 倪彤;用PageMaker 6.5排报版、杂志版[J];电脑知识与技术;2001年11期
20 吴晓茜;;一样的文本 不一样的精彩——《文本信息的表达与加工》教学偶拾[J];中国信息技术教育;2011年11期
中国重要会议论文全文数据库 前10条
1 彭泽映;俞晓明;许洪波;;大规模短文本的不完全聚类[A];第六届全国信息检索学术会议论文集[C];2010年
2 羌鑫林;刘许清;杨洁;高剑锋;;浅谈DGN数据中的文本信息到SHP格式的转换[A];地理信息与物联网论坛暨江苏省测绘学会2010年学术年会论文集[C];2010年
3 曹剑芬;陈方炘;;基于文本信息的韵律结构预测及其在合成系统中的应用[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 高璐;陈琪;李永宏;于洪志;;藏语语音合成中本文分析的若干问题研究[A];第九届中国语音学学术会议论文集[C];2010年
5 李广原;冯嘉礼;;基于属性坐标的文本信息检索模型[A];广西计算机学会2005年学术年会论文集[C];2005年
6 林丽玲;;商务口译中文本信息忠实性与文化信息忠实性[A];福建省外国语文学会2008年年会论文集[C];2008年
7 刘金松;于浩;西野文人;;基于网页上下文分析的图片检索[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 朱朝霞;;预期推理的结果及其表征的研究[A];第十届全国心理学学术大会论文摘要集[C];2005年
9 秦娜;张贵仓;魏伟一;;一种在图像中嵌入有意义文本信息的新型鲁棒水印算法[A];第十三届全国图象图形学学术会议论文集[C];2006年
10 运海红;韩咏;何晓宁;齐浩亮;;基于模板转换的平行语料自动获取[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 李丽洁;视频中文本信息提取技术研究[D];哈尔滨工程大学;2012年
2 王振;数字视频中文本的提取方法研究[D];中国海洋大学;2011年
3 黄晓冬;基于特征融合的视频文本获取研究[D];北京邮电大学;2010年
4 周景超;视频文本检测算法研究[D];中国科学院研究生院(自动化研究所);2008年
5 眭新光;文本信息隐藏及分析技术研究[D];解放军信息工程大学;2007年
6 孙巧榆;复杂背景图像的文本信息提取研究[D];华东师范大学;2012年
7 王智慧;可还原式数据嵌入技术的研究[D];大连理工大学;2010年
8 吴明巧;数字图像信息隐写与隐写分析技术研究[D];国防科学技术大学;2007年
9 吴戈;基于数字水印的文本信息隐藏方法的研究[D];长春理工大学;2011年
10 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 王利鑫;文本自动比对研究与应用[D];南京信息工程大学;2011年
2 刘华颖;基于角点与颜色特征的视频文本提取算法[D];河北大学;2011年
3 韩红斌;医学影像中文本信息嵌入技术研究与实现[D];沈阳航空工业学院;2010年
4 徐立新;互联网文本视频过滤技术研究与应用[D];电子科技大学;2010年
5 廖佳;网络图片中文本区域的定位技术研究[D];四川师范大学;2011年
6 潘道远;基于多方法融合的文本定位算法的设计与实现[D];江苏大学;2010年
7 卫莉莉;面向领域的Web文本采集与分类[D];西安建筑科技大学;2011年
8 赵爱群;视频文本提取算法[D];河北大学;2010年
9 邹莎莎;文本信息结构抽取方法的研究[D];大连理工大学;2010年
10 罗永峰;文本信息的空间化Web GIS应用研究[D];东北师范大学;2003年
中国重要报纸全文数据库 前10条
1 山东 牟晓东;三种清除空格的方法[N];电子报;2008年
2 闫洁;咱的信息:运营商保留那么久干啥?[N];新华每日电讯;2008年
3 蒋秀娟;常发短信会使人变笨吗?[N];科技日报;2007年
4 童岱;手机短信稳私安全吗[N];北京科技报;2008年
5 吴辰光;三大厂商抢食07年游戏机市场[N];北京商报;2007年
6 周蓉蓉;移动时代的变迁[N];计算机世界;2006年
7 山东 牟晓东;加密文字信息技巧两则[N];电子报;2008年
8 王朝选;讯飞语音助力中国航天[N];中国高新技术产业导报;2008年
9 李杰 李阳敏;短信:天上掉下个大馅饼?[N];计算机世界;2001年
10 ;IMS对VoIP的承诺[N];网络世界;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978