收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度图像和彩色图像融合的头姿估计算法研究

王润元  
【摘要】:随着信息技术的普及应用,互联网及物联网逐渐成为支持人们日常工作和生活不可或缺的平台。具有与人交互能力的人机自然交互模式吸引了越来越多的研究者,而智能的人机自然交互中,对人类用户行为的自动识别是该领域重要的研究基础。作为人类行为表现对象之一,头姿自动识别一方面可直接获得对人类用户对象行为的理解,另一方面也是表情分析、基于面部用户认证等应用的重要基础,然而,实际中由于人体头部运动具有很大随意性,加之受采集环境的影响,克服如旋转、光照等影响的头姿自动识别仍然是目前的难点及热点,因此研究有效的头姿自动识别算法具有重要的研究意义。为了提高头姿估计的准确性,本文采用融合方法,通过融合基于彩色图像以及深度图像中分别检测到的人脸关键特征点,计算特征,进而学习特征与头姿之间的映射模型,实现头姿识别。研究中,针对机器学习算法应用中,特别是面向头部、面部等视频、图像采集对象,样本单次采集、手工标定困难问题,本文研究并提出了一种半监督在线序列化学习的超限学习机(SOS-ELM)。实验表明,整个头姿估计算法对于特征点定位准确、鲁棒,学习算法快速、泛化性能好,能够较好地完成头姿估计,为后续自然人行为分析应用提供良好的技术支撑。主要的研究工作如下:1、实现了基于YCbCr颜色空间的灰度图像变换方法进行人眼定位。由YCbCr颜色空间转换后的灰度图像中利用Haar-like特征更能准确、鲁棒地完成人眼定位。2、提出基于深度图像的改进的Haar-like特征提取方法。针对深度图像丰富的空间信息,对于原始的Haar-like特征进行改进,改进后的算法提取的特征对空间旋转具有不变性,更适合头姿估计应用中特征提取。3、设计完成了基于坐标变换的人脸关键特征点融合方法。对于本文研究对象,采用特征级融合策略,在融合速度以及精度方面的权衡效果优于像素级融合以及决策级融合。特别是经过简单坐标变换,能够迅速准确地融合灰度图像与深度图像中特征。4、提出半监督在线序列ELM学习方法。该方法有效解决了实际问题中带标签样本费时费力难于获取的问题,充分利用易于获得的无标签样本,学习获得具有良好分类准确性与泛化性能的模型。此外,在线学习的特性是通过计算新来样本完成已训练模型的权重更新,大大节省计算量和内存。该算法在训练速度以及半监督学习性能方面具有良好的性能。上述所有研究工作均利用实验进行了检验,实验效果良好,达到预期目标。特别地,对于半监督在线序列ELM算法,本文在多个公共数据库上进行了实验测试,包括回归、二分类以及多分类数据库,实验表明提出的半监督在线序列ELM优于目前主流的SS-ELM以及OS-ELM等算法。该算法用于头姿识别取得了良好的识别效果。


知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978