智能机器人视觉图像最稀疏分解研究
【摘要】:机器人图像具有背景复杂、数据量大、实时变化、要求运算速度快的特点,若采用传统的Shannon采样方式对图像进行获取则会产生巨量的采样数据对后续的图像处理造成巨大压力。近年来,压缩采样或称压缩感知理论的提出使其得到有效的解决。对机器人视觉来说,图像处理的只是为了得到有用的特征信息,不需要完整的原始图像,因此只须在压缩域对低维数据进行处理并获取其特征信息,进而提高机器人的反应和运行速度。压缩感知理论把数据采样步骤与压缩步骤有效地结合起来。其理论方法以观测矩阵采样代替传统采样,其得到的测量值包含有丰富的足以恢复原图像信号的重要信息。实现压缩采样算法实现的首要前提是图像信号在变换基或者说字典上具有稀疏性,图像在所选择稀疏字典上越稀疏,测量采集的点数就变的更低,后期处理就越快,只有在合适的稀疏矩阵之上,信号的恢复精度和稀疏性才能得到保障。针对最佳稀疏分解的研究本文所做主要工作如下:(1)在对各种稀疏分解方法进行研究之后,本文认为通过学习获得的冗余字典具有更好的自适应重构图像的能力,能有效表达图像局部结构特点,使得信号在字典上有更稀疏的表示。但目前字典学习过程中存在计算复杂度较大耗时较多的问题。针对这一问题,我们分析了各种字典学习算法的原理,在字典更新阶段,本文方法以求近似解的方式替代了K-SVD算法中消耗时间最多的SVD分解,提出了一种近似K-SVD算法的简化方法,舍弃了K-SVD和近似K-SVD算法中字典更新阶段重复更新稀疏系数矩阵的过程。经实验对比认为简化的近似算法在不降低图像质量的前提下,一定程度上减少了字典学习所消耗的时间。(2)上述方法对字典更新速度上提高有限,计算复杂度较大,不能适用于机器人图像的稀疏表示。最近,一种被称作SGK的字典学习算法被作为经典K-SVD算法的有效替代,相比于K-SVD它具有更快的执行速度和与之相媲美的字典训练效果。但SGK算法仅通过单列字典的更新,计算复杂度仍有改善的空间。正是基于这一点,本文对SGK算法进行改进,提出了多列原子更新的字典学习算法,将SGK算法中的残差项变形为r列原子同时更新进而利用最小二乘法更新字典中的r个原子。实验仿真与计算时间复杂度分析结果显示本算法有效减少了单次迭代的计算量和字典学习的时间,提高了稀疏分解的效率。(3)针对机器人图像复杂度高、场景随机性大的特点,提出了一种适合于机器人图像的在线字典学习算法。在稀疏编码阶段采用上一帧图像字典学习得到的冗余字典,更新稀疏系数矩阵,使字典在学习过程中可以继承上一帧图像学习得到的有用信息并且不断地加入新的有效成分,使字典适应渐变的环境;字典更新阶段运用最小二乘法将字典的部分原子按次分批更新。较离线字典而言运用本文在线算法得到的字典进行稀疏表示和重构,图像质量有所提高,并且随着机器人场景图像的逐渐变化,其优势将更加明显。