图像拼接的关键技术研究
【摘要】:随着数字化时代的发展,现有网络带宽以及各种成像设备的显示能力大大提高,伴随而来的是影像采集设备也在逐步追求更大的分辨率、更大的视场角,由此应运而生了多种高清广角相机,此外使用软件的方法产生广角图像再次成为热门话题。广角相机等硬件设备虽然能获取广角图像,硬件同步之后的广角相机阵列甚至可以采集到高精度的全景图像。然而此硬件设备一般比较昂贵,并且不适用于一些特殊场景(例如机场等视野开阔领域,所成图像的失真比较严重),不适合普遍应用,因此使用软件的方法——图像拼接——得到广角、大视场图像又重新受到关注。图像拼接主要包含两个阶段:图像配准阶段和图像组合阶段。图像配准阶段得到单个或多个单应性矩阵,通过单应性变换将多幅有重叠区域的图像使得结构失真尽可能小的配准在一起;图像组合阶段主要使用单应性矩阵将待拼接图像进行组合,其中组合阶段可以通过一系列的后处理操作降低像素失真,使得最终的拼接图像主观性能更好。本文理论与实践结合,分析了基于3D重建的图像拼接方法的优缺点,在实际应用的机场场面多自由度多尺度空间建模项目中,基于此方法的改进构建出了更为精准的多自由度多尺度场景。此外,对于现有算法较难处理的视差图像的拼接,分析了基于几何变换的图像拼接方法的优缺点,提出了一种将图像按照景深分割的局部配准方法。本文的主要工作和创新点如下:1.在视频拼接过程中,为了提高4K视频拼接的效率,通过在一定时间内共享配准与后处理参数,适时调整配准周期从而大大降低了视频拼接的时间。此外,在图像配准阶段,通过划分ROI提高了特征的提取与匹配速度,降低了图像配准的时间,且使得图像的变换更符合所关注的区域,进而得到更好的配准效果,降低了结构失真,提升了主观性能。2.在数据预处理阶段,使用基于Shearlet变换的方法去除待拼接图像的噪声,抑制了无关噪声对提取特征的影响,增加了图像提取特征的精确度,提高了机场场面多自由度多尺度空间建模的准确度。3.当相机基线距离过大,且拍摄场景具有多个景深,图像视差现象较为明显。针对此情况,提取了一种“分层次”的图像拼接方法:基于景深的自适应位置补偿的视差图像拼接方法。通过与常规方法的对比,证明了理论的可行性与有效性。