基于集成学习的人脸识别算法研究及应用
【摘要】:
人脸识别研究作为模式识别研究中的重要部分,它有着其他识别技术所无法超越的优势,它具有安全性、直接性、隐蔽性等优点。目前对人脸识别的研究主要集中在人脸图像的特征提取和人脸的正确分类两方面。
本文先对人脸识别当前的研究现状和主要的方法进行了阐述,然后对人脸识别中的关键技术进行了相应的研究,在此基础上提出了组合核规范化线性判别分析方法,并结合集成学习的方法形成基于集成学习的规范化线性判别和基于集成学习的组合核规范化线性判别分析人脸识别算法。
首先,利用规范化的线性判别准则来解决小样本问题。通过调整规范化系数,降低特征值大的特征向量的影响同时增大特征值小的特征向量的影响,利用偏差的降低来解决小样本问题。
其次,在线性判别分析(LDA)的基础上,给出了一种基于组合函数的方法.通过核函数实现低维非线性空间到高维线性空间的非线性映射,在高维空间中利用改进的线性判别分析规则找到最具有鉴别能力的特征向量从而构成最优的非线性样本表示特征。
最后,利用集成学习的算法,通过训练多个弱分类器并对其结果进行决策,从而显著提高学习系统的泛化能力。本文主要使用的是Adaboost算法,它有两种变形的算法,分别是Adaboost.M1和Adaboost.M2。其中Adaboost.M1具有很好的泛化能力,但是当弱分类器的分类错误率达到50%以上时,该算法将会提前停止执行。为了避免这种情况的产生,Adaboost.M2算法引入了伪损失变量,利用伪损失变量,只要分类器的性能稍好于随机猜测,算法就能一直执行下去。通过这样的方法,Adaboost.M2不但能集中学习难分离的样本对,而且能同时学习错误分类的样本。
基于集成的方法,同时利用了LDA算法和Boosting算法的优点,在每一次的迭代过程中引进一个加权函数对难分离的样本增加权重,增加分类器之间的差异度,从而提高样本在新的特征空间中的可分离性。