三维特征描述方法及应用研究
【摘要】:三维特征描述是基于三维数据对空间物体智能感知的重要手段,也是模式识别和三维视觉中的基础工作,广泛应用于工业测量、医疗诊断、文物保护、机器人及自动驾驶等领域。随着传感技术的发展,基于三维数据的应用场景越来越丰富且复杂,这使得三维数据变得海量且多元化,三维视觉任务也从三维重建向高层感知方向发展,传统的三维特征描述在精度、效率及高层语义表达等方面已无法满足当前技术发展趋势。为此,本文针对三维特征描述面临的主要挑战,开展了相关理论、方法和应用方面的研究。研究主要围绕复杂场景下三维数据的多层次鲁棒特征结构化表达,研究如何高效地从复杂场景数据中提取三维局部几何特征,物体特征及语义特征等用于场景感知。三维特征描述贯穿计算机视觉的三个层次,即低层视觉中像素级几何特征描述,中层视觉中物体级重建,和高层视觉中语义级感知。本文依此层次划分开展相关研究,主要工作如下:(1)传统三维空间网格划分特征描述复杂度较高的问题,提出了一种局部高度图像特征描述方法。该方法通过向量内积实现了快速的局部高度图像构造,并利用网格划分、均值统计、高斯滤波等策略提升了复杂噪声场景下三维特征描述的精度。该方法在二维空间中实现了更加紧凑的三维局部几何特征描述,且不会造成信息损失。实验结果表明,该方法在精度上与当前最优方法接近,效率却提升了大约7倍,实现了效率与精度的平衡。(2)针对局部描述子中局部参考系(Local Reference Frame,LRF)估计效率低和二维投影方法中部分特征失效的问题,分别提出了 LRF简化方法和良态空间优化理论。优化方法中通过简化协方差矩阵,缩小计算范围来提高LRF估计效率和鲁棒性;并通过对原有病态特征空间进行非线性加权,使之更接近于良态,来提升特征空间描述能力。在局部高度图像描述子的基础上,基于上述优化方法进一步提出了加权高度图像描述子。相比传统方法,该方法中LRF估计与信息编码不再独立而是融为一体,因此效率更高,且描述能力提升的同时也降低了对维度的依赖,因此更加紧密。实验表明,提出的加权高度图像描述子不仅特征提取速度和精度优于现有方法,而且在紧密性方面,相比最优方法又进一步提升了 6.89倍,实现了效率、精度、紧密性等各方面性能的同步提升。(3)针对三维重建中物体特征的描述问题,提出了一种基于加权高度图像描述子的由粗到细的点云配准方法,以及一种基于单视角点云的三维重建算法。其中点云配准方法通过局部特征描述实现快速鲁棒的粗配准,然后利用迭代最近点算法实现精配准。三维重建过程首先利用该点云配准方法对原始点云数据进行预处理,然后结合计算机辅助设计模型处理、表面重建、边缘重建等过程实现了基于单视角点云的三维重建。该重建算法解决了传统方法无法重构遮挡区域的问题。本文以高铁受电弓三维重建为例,验证了重建算法的效率与精度,实现了 20 s内受电弓三维重建和检测,其重建误差在0.2mm左右,测量误差小于0.7mm,满足高铁受电弓三维重建、检测和可视化的实际工程需求,展示了重建算法的实际应用价值。(4)针对三维物体的高层语义特征表达问题,提出了一种基于高次曲面学习的语义特征描述方法。该方法利用深度学习网络学习一系列全局参考曲面,并将传统的点云欧氏坐标表达转化为物体点云与全局参考曲面的相对关系,即点面表达,实现了点坐标到几何信息的转变。相比传统的点云、深度图像或体素表达等,该方法直接以局部和全局几何特性进行表达。通过线性方程组解的唯一性证明,该表达方法不会造成有效信息的损失,且更符合人类对三维物体判别感知的机制。点面表达实现简单,可即插即用地嵌入到现有的三维深度学习网络中用于点云分类、分割及场景理解等。实验表明该方法在常用公开ModelNet分类数据集、ShapeNet分割数据集下,均实现了最优性能,证明了点面表达方法的全局语义特征描述能力。