字幕数据库的建立以及基于字幕的视频检索方法的研究
【摘要】:随着视频节目的制作和积累,节目数量在急剧增加。人们如果想要在所有节目中寻找自己感兴趣视频片段,就变的越来越困难。因此人们迫切需要一种视频搜索技术,能够从大量的视频节目资源中查询自己感兴趣的一段节目,例如:足球比赛中的射门镜头、一个演员的所有作品等。这就是视频的检索。
本文首先列举了目前现有的视频检索方法,并分析了他们的优点和缺点。视频检索方法主要有基于文本信息的检索方法,基于帧的视频检索方法,以及基于内容的检索方法。
基于文字的检索技术,通过描述该视频片段的文字信息,比如视频文件名称,备注,标题等信息,进行相关视频的搜索。由于文字搜索技术发展很完善,有大量检索算法可用,所以方法简单,计算量小,搜索速度比较快。但由于这些文字信息内容有限,不能细致的描述视频的每一个片段,因此不可能细致的搜索到所有待查视频片段,也就是搜索准确度低。
基于帧的视频检索,就是将待检索的参考帧和每视频中的每一帧进行比较,可以找出所要求的视频片段。但是,由于视频中存在大量的帧,比较每一帧是不可能的,因此出现了结构化视频分析和检索,将视频分割成视频、场景、组、镜头、关键帧五个层次,依次从高层到低层进行搜索,这样就提高了搜索速度。但这要用到视频的结构分析技术,需要进行场景分割,镜头分割,计算量比较大,算法复杂,搜索速度低。
基于内容的视频检索,首先对视频进行对象分割,提取并描述视频对象的特征和内容,存储于对象数据库中。然后根据检索时提供的对象特征,在对象数据库中进行检索。它的优点是搜全率高,缺点是计算复杂。
作者综合以上几种方法,提出基于字幕的视频检索方法。该方法既具有文字检索方法简单快捷的特点,又具有基于内容检索方法的查找精确的特点。该方法首先提取视频中的字幕信息,并存储在数据库中。检索时只要输入一个字幕信息,就可以检索到该字幕出现的视频。