多模态融合的新闻故事单元分割
【摘要】:
对视频数据的有效处理、浏览、检索和管理正伴随着视频数据的快速增长而成为亟待解决的现实问题。视频内容分析技术旨在将非结构化的视频数据结构化,并提取其中的语义内容,构建低层特征到高层语义之间的桥梁,最终建立视频的摘要、索引和检索等应用系统,提供给用户方便的视频内容获取方式。
本文以新闻视频为研究对象,通过对字幕、音频、视频这三个不同类型信息的研究,实现了对新闻视频故事单元的分割。并以Visual C++为开发平台,设计并实现了一个新闻视频故事单元分割系统。
本文首先对视频进行了结构化的处理,提出了一种改进的镜头边界检测方法,即对运动补偿之后的像素不变点采用自适应双阈值来判定切变镜头和渐变镜头。在此基础之上,对一种字幕检测算法进行了改进,利用小波变换提取图像特征,对其进行模糊C均值聚类,判断出图像帧中的字幕信息;同时以提取的关键帧为基础实现一种主持人镜头的检测方法,利用新闻视频中主持人镜头的固有特点,提取区域图像的颜色特征进行判断,将镜头分为主持人镜头和一般报道镜头。
本文利用基于隐马尔科夫模型的音频分类算法,提取视频中的底层音频信息特征,首先对音频进行静音判断,然后使用隐马尔科夫模型对其进行分类,实现对新闻音频信息的分类与识别。
最后本文以Visual C++6.0为编程平台,实现了新闻故事单元分割系统,完成了对新闻视频的镜头检测、字幕检测,音频分类识别,主持人镜头检测,新闻故事单元分割以及数据库的管理和检索。
|
|
|
|
1 |
王策,何炎祥,王云,张春林;基于视音频特征和文本信息的新闻视频自动场景分割[J];计算机工程;2005年06期 |
2 |
刘华咏;基于音视频特征和文字信息自动分段新闻故事[J];系统仿真学报;2004年11期 |
3 |
于俊清,汤旸,周向东;利用主色模板匹配检测新闻视频口播帧[J];计算机辅助设计与图形学学报;2005年03期 |
4 |
王艳;李莉;;基于3/10时空切片的主题字幕边界帧检测[J];大众科技;2010年09期 |
5 |
陈凯江;欧嘉致;黄萱菁;吴立德;;新闻视频、音频中的主题检测[J];计算机科学;2002年11期 |
6 |
于俊清,汤旸,闫冬,周洞汝;基于规则分析的新闻视频口播帧检测[J];计算机工程与应用;2004年06期 |
7 |
朱志辉;;基于视频摘要生成技术的研究[J];微电子学与计算机;2006年02期 |
8 |
徐新文;李国辉;付畅俭;;基于MWH模型的新闻视频语义挖掘[J];计算机工程;2009年17期 |
9 |
邵晨曦;李海波;王李忠;;基于Prewitt算子的新闻字幕检测[J];电子技术;2009年11期 |
10 |
吴玲达;文军;陈丹雯;袁志民;;新闻视频故事单元关联分析技术研究综述[J];计算机科学;2010年06期 |
11 |
袁美英;;加强新闻视频档案管理工作之浅见[J];浙江档案;2010年08期 |
12 |
李默,李弼程,邓子健;新闻视频主持人镜头的半屏幕检测算法[J];计算机工程与应用;2005年15期 |
13 |
王倩;;古永锵无畏寒冬积极转型 在线视频新闻好看不好做[J];IT时代周刊;2008年24期 |
14 |
王伟;李丹丹;;基于网络的新闻视频实时发布系统[J];安徽科技;2009年08期 |
15 |
徐峰;梁学战;;新闻视频帧中的标题字幕探测[J];中国科技信息;2009年23期 |
16 |
刘海涛;老松杨;郭金林;白亮;;一种快速新闻视频标题字幕探测与定位方法[J];计算机应用研究;2011年08期 |
17 |
高健;叶静;陈莹莹;聂藩;;基于动态自动提取模板的实时口播帧检测方法[J];电视技术;2006年12期 |
18 |
高健;郭梦琦;沈辉;赵其杰;;一种基于分布特点的口播帧识别算法[J];光电子.激光;2007年06期 |
19 |
刘宇驰;栾悉道;谢毓湘;吴玲达;;新闻视频中非新闻段的去除[J];小型微型计算机系统;2007年10期 |
20 |
彭天强;李弼程;;一种有效的抗闪光灯新闻视频镜头检测方法[J];信息工程大学学报;2007年04期 |
|