面向人脸和掌纹特征提取的线性降维技术研究
【摘要】:
人体生物特征技术利用人体所固有的生物和行为特征来进行自动身份鉴别和认证,已经被广泛应用于各种门禁、监控与安全系统。人脸和掌纹识别是两种代表性的人体生物特征识别技术。人脸识别具有广泛的潜在应用前景和深刻的理论价值,已成为近十年来计算机视觉和模式识别方面的研究热点之一。手掌区域含有非常丰富的和稳定的身份鉴别特征,采集设备价格较为低廉,使得掌纹识别最近成为生物特征识别技术中的一个重要分支。
特征提取或数据降维是发展生物特征识别系统的一个重要支撑技术。生物特征数据的维数往往非常之高,并且往往包括与一些身份鉴别无关的冗余信息。利用数据降维技术,我们不但可以从生物特征数据中提取稳定有效的身份鉴别特征,还可以尽可能的消除这种信息冗余。由于其简单性、有效性及较好的泛化能力,线性降维技术已经被广泛应用于各种人体生物特征数据的特征提取。
在人脸和掌纹识别中,图像维数一般远远高于训练样本的数目(小样本问题),因而人脸和掌纹已成为高维数据的线性降维技术的一个重要研究和测试平台。小样本问题会导致散度矩阵的奇异性和较大的估计偏差,导致特征提取对训练样本产生过拟合。此外,生物特征识别系统的自动获取、检测和识别生物特征数据的过程中有时会不可避免地引入噪声或局部遮挡。噪声或局部遮挡会导致传统的主成分分析和线性判别分析方法的识别率下降,我们称之为鲁棒性问题。
本文从泛化能力和鲁棒性的角度,以人脸和掌纹特征提取为例,研究了线性图像降维技术中存在的问题,并提出了一系列的解决方法,主要包括:
(1)双向主成分分析技术:我们提出一种双向主成分分析技术来改善传统主成分分析方法的泛化能力问题。双向主成分分析具有以下三个显著优点。首先,双向主成分分析是一种直接基于图像矩阵的投影技术,不需要事先将图像矩阵转换为图像向量;其次,双向主成分分析能够有效解决主成分分析的过拟合问题;最后,双向主成分分析不存在二维主成分分析的高特征维数问题。
(2)组合矩阵距离(AMD):鉴于双向主成分特征是一个矩阵,我们定义了一种组合矩阵距离方法来度量特征矩阵之间的距离,并从理论上证明了AMD距离是一种矩阵距离测度。实验结果表明,在双向主成分特征空间下,无论是使用最近邻还是最近特征线分类器,AMD距离都能取得比Frobenius和Yang距离方法更高的平均识别率。
(3)双向主成分子空间判别分析技术(BDPCA+LDA):BDPCA+LDA采用了一种两阶段框架,即首先利用双向主成分分析对图像降维,然后在低维双向主成分子空间下进行判别分析。与常用的PCA+LDA相比,BDPCA+LDA具有计算速度快、内存占用小和识别精度高等优点。
(4)判别分析的后处理技术:后处理技术使用二维高斯函数来平滑判别向量,因而可以与一些主流的线性判别分析方法如增强Fisher判别模型和完全Fisher判别相结合,进一步提高识别精度。后处理技术在理论上与广义欧氏距离法等价,但在识别阶段后处理技术具有更快的特征提取速度。
(5) BDPCA+LDA与后处理Fisherfaces方法的融合:我们提出一个后处理Fisherfaces与BDPCA+LDA的融合方法。鉴于这两种方法的判别向量差别较大,识别率相近,二者的融合会进一步改善识别精度。实验结果表明,融合方法能够取得高于后处理Fisherfaces、BDPCA+LDA及其它常用LDA方法的识别率。
(6)特征脸的循环加权匹配法( IRF-Eigenfaces ):提出一种IRF-Eigenfaces技术来解决传统的特征脸方法在识别噪声和局部遮挡图像时的精度下降问题。IRF-Eigenfaces通过定义一个广义能量函数,并用循环加权最小二乘法最小化能量函数来提取特征向量。实验结果表明,IRF-Eigenfaces在识别噪声和遮挡图像时具有优于特征脸和局部概率等方法的鲁棒性。