足球视频场景分析与三维重建的关键技术研究
【摘要】:
多媒体信息的爆炸式增长要求人们研究开发视频检索技术。近年来,以体育视频内容分析为主要目标的研究已经成为热门领域。这项研究主要为观众提供精彩摘要并以多种形式呈现给用户。虽然经过十余年的努力,这一领域已经取得了长足进步,但当前取得的成绩与人们的期望还有很大距离。
本文针对足球视频场景分析与三维重建中的若干关键技术进行了比较深入的研究,旨在提高它们的鲁棒性和可应用性。文中工作集中在以下三个方面:1)自动的球场检测算法,这项技术是场景分析与三维重建工作中共用的技术;2)运动对象的检测和跟踪,在体育视频中运动对象主要是指球员和球;3)从单视点广播视频中重建三维场景技术。本文的主要创新工作有:
1.本文提出了一种基于本征图像的自动球场颜色检测算法。作为体育视频分析研究中一项关键技术,球场检测严重地受到阴影区域的影响,此算法可以有效地克服这一困难。算法首先自动地在色彩分布直方图中检测主颜色。因具有相似表面反射函数的像素值在正确的本征图像投影方向投影后,它们具有关于某一点对称分布。依据此特性,算法用已检测到的主颜色粗标定本征图像的投影方向。在此方向的指导下,算法根据本征图像的分布来判断第二主颜色是否是球场颜色的。此外,当确定了球场中阴影区域和非阴影区域后,本文提出通过最大化二者本征图像的分布相似度精细标定相机的本征图像的投影方向。实验表明此算法可以比较准确地检测球场颜色,同时精度的本征图像投影方向为在含有阴影区域的目标跟踪提供了一种光照不变的表观特征。
2.本文提出了一种自适应的球场检测算法。针对广播视频流中的数据具有数量大、噪声多、同时来自多部相机的特点,在检测到的球场颜色的基础上,算法采用高斯混合模型对其建模,并且利用增量期望最大算法对模型参数进行在线估计。算法一方面提高了球场检测的效果,另一方面减少训练过程对数据存储的开销。实验表明,由于增量学习方法不断地强化模型的泛化能力,此算法取得了比单纯的直方图方法和一般的高斯混合模型方法更好的结果。
3.本文提出了一种顺序数据关联策略应用于多目标的跟踪。多运动目标跟踪受到对象之间相互遮挡的困扰。因为比赛场地是平面,根据成像规律