基于脉冲神经网络的目标检测技术研究
【摘要】:在大数据时代到来与计算能力飞速提升的背景下,人工神经网络(Artificial Neural Network,ANN)中的深度神经网络经过训练可以获得很高的精度,但是随着任务场景的日益复杂,模型的参数量和计算量也急剧增长,由此带来更高的存储、计算和功耗需求。而基于神经形态计算的脉冲神经网络(Spiking Neuron Networks,SNN)自身具有计算量小、功耗低、信息传递速度快等优点,为上述问题提供很好的解决方案。然而脉冲神经网络固有的训练困难的特点,导致其难以推广应用于复杂的机器视觉应用中,所以,面向新模型结构和训练策略的探索对脉冲神经网络的研究和工程应用具有重要的意义。本文首先选择了具有固定激发阈值的LIF神经元模型构建脉冲神经网络模型,并通过基于对LIF神经元群体编码的方法实现了对目标的识别和检测。与H-H模型进行累积操作需要1200次浮点数操作相比,该模型仅仅需要5次,大幅提升了计算效率。此外,本文在所选定的LIF神经元模型上应用群体编码方案实现了信息传递,该方案利用神经元群体来对输入的刺激信号进行编码,解决了之前所使用的编码方式对模拟量表示不够准确的缺点,达到了更加接近生物神经元表达信息的效果,使网络处理信息的过程更加具有仿生学特性。最终在图像分类数据集上得到了98.73%(MNIST)和86.43%(CIFAR-10)的准确率,搭建的Tiny YOLOv2模型在VOC2007目标检测数据集上的m AP为20。由于对LIF神经元群体编码的脉冲神经网络所得到的效果有限,本文进一步探索了基于参数迁移转换网络的方案。该方案基于脉冲神经元激发的脉冲序列频率与模拟神经元经过激活函数的激活值相匹配的原则,采用参数迁移转换的策略,先识别后检测,以YOLO模型为研究对象将其参数实现了从人工神经网络到脉冲神经网络的转换,包括对残差和FPN结构都提出了对应的实现方式。针对网络后层神经元激活不足的问题,本文不仅使用了普通的归一化,而且提出了基于归一化比例的通道归一化方案,经过实验验证,后层神经元的激活率得到了明显提高。最终在MNIST和CIFAR-10数据集上得到了99.28%和86.82%的准确率,达到了可与原网络相媲美的结果,使用YOLOv3模型在VOC2007数据集得到了41.23的m AP。由于脉冲神经网络信息传递速度快、占用资源少,并且本文中SNN的功耗仅仅为原网络的1/5,所以此研究方案在实时性要求高但是计算资源有限的场景有着较大的适用性,为研究脉冲神经网络在更复杂机器视觉任务中的应用提供了思路和参考价值。