海量训练数据如何影响人脸检测器性能:实验研究
【摘要】:
人脸检测(Face Detection)是指对于任意的一幅输入图像,通过一定的搜索方法,判断其中是否有人脸存在;如果其中包含人脸,则返回人脸所在的数目、位置及其大小等信息。一方面,人脸检测具有广泛的应用前景,例如人脸识别、视频监控、人机交互、图像检索、视频会议和数码相机等;另一方面,对于人脸检测的研究可以为其它的目标检测和识别问题提供重要的启示。因此,人脸检测在近来年一直是计算机视觉研究领域的一个热点问题。
经过数十年的研究,人脸检测得到了快速的发展。针对人脸检测,至今已经提出了很多检测方法,并取得了很好的检测效果。然而,其中很多人脸检测算法,它们共同的特点是对海量人脸训『练样本的依赖,且所使用的大型训练样本的构建几乎也都相当任意。由于Internet的发展,海量图像数据变得很容易就能够获得。海量的人脸样本可以提供模式更为多样化的人脸,有利于训练出高检测率的检测器。然而,使用海量的人脸样本,往往也会导致分类器在训练阶段所耗费的时间过长,对硬件方面相应的要求也会提高。训练数据的规模和性质如何影响检测器的性能已成为人脸检测研究中的一个重要问题。对该问题的研究,利于实现对海量人脸样本集进行优化,同时对于其它研究领域中进行样本的优化也有着重要的启示作用。
本文基于一个典型的正面人脸检测器算法,对上述问题进行了大规模实验性研究。具体地,本文针对人脸图像中包含的5种常见变化,即光照、表情、图像模糊度、对比度、噪声,构造了一个包含34万张人脸图像的大型训练集,在此基础上研究了上述5种因素对检测器性能的影响。本文的实验结果表明噪声图像对检测器具有重要影响,而光照、表情等变化的影响相对较弱。文中由此提出一种新的构建训练样本集的方法,该方法对原有的海量训练样本具有一定的优化作用,并取得了较好的实验效果。