基于激光雷达点云的自动驾驶场景语义理解方法
【摘要】:自动驾驶车辆是一种能够感知环境并且无需人工干预即可行驶的车辆,随着人工智能的高速发展与应用,自动驾驶也随之逐步成熟。激光雷达可以稳定快速地获取大规模场景三维空间信息,已成为自动驾驶场景理解的重要传感器。激光雷达点云包含场景中丰富的语义信息,是理解、分析和解译自动驾驶场景的主要数据类型。激光雷达点云具有高密度、高精度、海量的特点。近年来,基于激光雷达点云进行复杂自动驾驶场景语义理解的研究已取得长足的发展。精准、鲁棒的自动驾驶场景语义理解技术在如今具有重要的理论价值和现实意义。本文针对基于激光雷达点云的自动驾驶场景语义理解展开研究,包含以下三方面的内容:1、为了解决当前包含大量复杂场景的激光雷达点云数据集匮乏的问题,本文首先建立了 ScienceIsland数据集。该数据集包含多种复杂场景,采集车辆沿途经过桥梁、建筑物、湖边,道路两旁有大量植被、草坪及树木,沿途有很多步行的行人、骑手以及正在行驶的汽车、卡车等,可充分满足自动驾驶场景语义理解的需求。接着,本文提出了一个准确的点云语义分割框架。通过将输入点云通过球面投影转化为距离图像、二维卷积神经网络语义分割、将距离图像通过语义分割得到的语义标签反投影回原始点云、对语义边缘精细的后处理分割四步实现对完整点云的语义分割。本文的实验评估表明,本文改进的二维深度卷积神经网络在距离图像上的表现优于目前激光雷达点云语义分割方法,但可能导致语义边缘模糊的问题。为此,本文通过对原始点进行语义重构使得原始点云中的所有激光扫描点均能得到语义标签。除此之外,本文高效的后处理还可以恢复在投影过程中丢失的重要语义边界信息。本文提出的方法在准确性上朝着实现自动驾驶激光雷达点云的完整语义分割迈出了坚实的一步。2、提出了一种基于卷积神经网络和概率占用栅格的地面分割方法,能够在复杂驾驶场景中实时、有效且准确地实现地面分割。针对分割结果不够精准的问题,通过轻量级卷积神经网络提升了地面点粗分割效果,在保证实时性的同时更为精准;同时,级联概率占用栅格地图建模,利用时序信息优化地面分割结果;为了提高算法对复杂环境的鲁棒性,本文提出的方法将激光雷达原始数据按其位置分为三个子集:内部区域、前向区域和后向区域;然后,通过迭代重加权的线性平方模型利用估计的地面点来建立坡度函数;最后,基于区域策略分区域估计斜率直线实现了前向和后向区域的地面分割。针对逐点的分割结果时空复杂度太高并且无法直接应用于自动驾驶车辆的决策规划的问题,本文采用占用栅格地图来表示和量化地面分割结果,实验结果表明,本文所提出的方法在不同复杂场景下均具有良好的鲁棒性和准确性,能够实时地实现地面分割。3、提出了一种越野环境下基于点云的负障碍物检测方法。该方法包含以下几个步骤:几何特征提取、局部地面拟合、候选点对滤波、MSMF和候选点聚类。在不同的地形条件下进行了试验。实验结果表明,该方法在不同地形条件下具有良好的鲁棒性。所提出的方法主要有以下三方面贡献:为了提高算法在复杂环境下检测负障碍物的鲁棒性;通过估计潜在负障碍物周围扫描地面的向量,自适应调整阈值,结合负障碍物周围地面的几何特征和向量,本文提出的方法可以在不同地形条件下检测出负障碍物;进而用贝叶斯规则进行迭代,本文利用车辆位姿来对齐时空中多个激光雷达上的多个负障碍物特征点,融合多个激光雷达多帧检测到的负障碍物特征,提出的方法不仅可以提高负障碍物的最大检测距离,还可以避免由于单个激光雷达被遮挡导致的漏检,避免盲区造成的漏检,提高了检测精度;设计了一种越野环境下自动驾驶车辆多激光雷达安装方式。与传统的直立安装方式不同,该方案在车顶侧向安装多个激光雷达,以减少车体周围的盲区,提高扫描线的密度。本课题致力于对基于激光雷达点云的自动驾驶场景语义理解技术进行研究,在城区和越野环境等自动驾驶场景中进行了大量实车测试,验证了所提出的自动驾驶场景语义理解算法的鲁棒性和准确性。最后总结了本课题的主要贡献和创新之处,并对自动驾驶场景语义理解未来的研究方向进行了展望。