视频中关键帧提取技术的研究
【摘要】:随着计算机网络和多媒体信息技术的飞速发展,人们的生活已离不开网络,信息的获得大都来自于互联网,网络中的信息资源的表现形式主要有三种:视频、图像和文本。由于视频看上去比较直观,并且内容丰富,让人们能够通过亲身体验来获得对自身有用的信息,被广泛应用于日常生活的各个领域中比如教育、医疗、影视、体育等。然而视频包含的数据量很大,并且结构复杂,使得快速有效地访问和检索视频变得十分困难。关键帧是描述视频主要内容的图像帧,也是实现视频检索的关键技术,本文主要对关键帧的提取技术进行了研究。
本文首先介绍了关键帧提取技术的研究背景和意义,以及国内外的研究现状,然后对当前比较流行的一些关键帧提取方法进行了阐述和详细的分析,并对每一种方法进行了测试。常见的关键帧提取算法有:1、基于镜头边界的方法;2、基于图像内容的方法;3、基于聚类的提取方法;4、基于运动分析的方法;5、基于压缩视频流的方法。以上这些方法均有各自的优缺点和一定的局限性,只适合于特定的视频,不具有广泛的适应性。针对以上这些关键帧提取方法的不足,本文提出了一种新的关键帧提取方法,基于图像信息熵和边缘匹配率进行关键帧的提取,首先计算每帧图像的信息熵,选取信息熵取局部极值时所对应的帧作为候选关键帧,然后利用Prewitt算子提取候选关键帧的边缘,对相邻帧进行边缘匹配,若相邻帧的边缘匹配率大于等于50%,则当前帧即为冗余关键帧,将其舍弃。该方法不需要事先设定阈值,根据视频的内容来动态决定关键帧的数量,具有很好的适应性,对各种视频进行了测试,实验表明提取出的关键帧代表了对应视频的主要内容,为视频检索和视频检测提供了一个良好的基础。