收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

视频中文本的定位与提取

刘子玉  
【摘要】:当今时代,随着通信设备和数字多媒体技术的飞速发展,带宽和存储已经不再是制约人们观看高清视频的阻碍,互联网媒体传播也逐渐从文本时代、图片时代,走入了视频时代。如果我们能够对视频中的文本进行定位并提取,就能得到视频中非常丰富的文本信息。这是计算机视觉与人工智能领域中有较高研究价值的课题,有助于对视频中高级语义信息的理解和检索。本文分析了现有的视频文本定位与提取系统中存在的问题和难点,提出了一个高效的视频中文本的定位、分割、提取系统。首先对输入的视频文件进行解码,以固定频率抽取视频帧图像。针对视频帧图像,文本定位分为两个阶段:第一阶段,提取视频帧图像的角点响应图,利用灰度级形态学操作和自适应的阈值分割获取文本候选区域。第二阶段,通过提取文本候选区域的笔画宽度直方图特征,利用机器学习的方法判断候选区域是否为文本区域。对于文本区域的分割,采用一种基于模糊C均值聚类的方法,根据像素点的颜色和位置信息进行聚类,对背景图像进行颜色分层,从中提取出文本层。最后,再利用形态学的方法对分割中造成损失的文字骨干进行修复,进而完成字符分割。文本分割的结果输入光学字符识别软件,即可得到文本信息。实验结果表明,对比以往算法,本文系统在查准率、查全率、f-measure等性能上都有了很大的提高。


知网文化
【相似文献】
中国硕士学位论文全文数据库 前2条
1 刘子玉;视频中文本的定位与提取[D];天津大学;2016年
2 邢宁;面向文本分类任务的主题强化词句嵌入模型研究[D];天津大学;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978