基于多级特征融合的小目标深度检测网络研究
【摘要】:卷积神经网络在通用目标检测任务中取得了优异的表现,但在解决小目标检测这类任务时仍面临较大的挑战。作为自动驾驶、智能安防等重要任务的下游基础,小目标检测的难点主要在于待检目标的尺寸小、分辨率低、携带信息不足,对网络的特征提取和融合能力的要求更高,因此面向常规任务的通用目标检测网络在小目标检测中的效果不够理想。对此,本文分析小目标任务下的通用网络在多级特征的提取与融合方面的不足,分别对模型的主干网络和检测头部进行针对性的改进,进而构建面向小目标检测的深度卷积网络。本文首先通过可视化分析总结出通用检测网络各部分在小目标检测中的不足,即主干网络部分在提取小目标特征时存在特征品质较低且部分特征冗余,检测头部在分类回归时难以兼顾小目标的浅层细节特征和高层抽象特征。然后,本文针对性地设计了浅层特征品质与融合效率更高的主干网络SFEDNet(Split-and-fusion Efficient Dense Net),在连接层级上增设感受野更小的卷积分支以提取更多的细节纹理信息。在模块级上进行结构精简,提出了融合方式更加高效的优化密集连接模块,进而将浅层特征融合的思想应用到模块间连接,使得浅层特征得到跨模块复用。最后本文为检测头部引入通道-空间融合注意力模块:对于通道注意力模块,设计了一种新的多频域融合方式代替传统的“全局平均池化”,更好地保留小目标检测所依赖的重要浅层信息,增加网络对小目标区域的有效关注;对于空间注意力模块,采用不同尺度的空洞卷积替换普通卷积,更快地弥补主干网络缺失的大尺度背景区域的感知能力,减少对背景区域的无效关注。本文实验选择无人机视角下的小目标检测作为任务场景,以通用检测网络和部分小目标检测算法为基准展开对比实验。实验结果表明,改进后的网络相比通用网络在小目标任务中取得了约8%的精度提升。本文还结合了实际的检测结果与热力图分析,直观展示并验证了改进后的注意力模块对多层级特征兼顾问题的有效改善。