面向目标检测识别应用的算法加速器体系结构研究
【摘要】:
无论在军事还是民用领域,目标检测识别技术都具有重要的研究意义和应用价值。人们提出了很多方法来提高目标检测识别的准确性,且取得了显著的成果,但是在提高目标检测识别处理速度方面的相关研究较少。
事实上,在将目标检测识别技术应用于实际系统中时,除了保证足够高的识别准确率,识别速度能否满足系统对实时性的要求也是一个关键问题。另外,目标检测识别系统的体积、实现代价、功耗以及对不同应用环境的适应能力也是需要研究的问题。
基于FPGA(FieldProgrammableGateArray)的硬件加速技术能够实现较大程度的算法到计算引擎的空间映射(区别于通用处理器),且具备计算和存储资源的定制能力(区别于ASIC(ApplicationSpecificIntegratedCircuits)),因此在灵活性和高性能方面做到了比较好的权衡。同时,FPGA硬件加速器与通用处理器相比还具有体积小、功耗低的优势。
基于FPGA的硬件加速技术对于提高目标检测识别技术的实用性具有重要意义。本文研究面向目标检测识别应用的算法加速器体系结构,主要研究四类应用:静态刚性目标识别、运动目标检测提取、行人检测识别、人脸检测识别,研究目的是实现算法到有限硬件资源的充分高效的映射,在硬件实现代价、处理速度和处理效果之间进行适当的折中。基于研究成果为这四类应用分别设计了基于FPGA的硬件加速原型系统。同时,针对行人、人脸检测识别等一类具有不规则数据访问模式的图像处理应用提出了一种通用无冲突并行访问存储模型。
首先研究了基于Hausdorff距离与模板匹配的静态刚性目标识别硬件加速技术。静态刚性目标识别应用的数据访问模式较规整,但是计算复杂性较大。本文提出了面向大尺寸窗口遍历型应用的并行计算模型,目的是实现运算单元的数据消耗速度与存储系统的数据供应速度之间的均衡。将基于多体存储结构的无冲突并行访问存储模型与基于分治并行策略的多PE(Processing Element)计算结构相结合,缓解了只采用前者时所遇到的存储体个数太多的问题以及只采用后者时所面临的存储容量受限的问题。性能分析与实验结果表明采用该计算模型可以显著提高运算单元的并行度。
其次,研究了运动目标检测提取算法的硬件加速技术以及存储优化技术。相对于静态目标,在现实场景中,人们往往对运动目标更感兴趣。本文设计了对图像中不同运动目标进行分类的硬件加速结构;针对图像序列中运动目标数量、位置、大小等信息不断变化的特点,引出了“可变数据集合维护问题”,设计了一种通用的高速硬件链表结构,提高了对可变数据集合进行存取访问的灵活性。
接下来,对于检测并提取出的运动目标,后续工作通常是运动目标识别。本文选取运动目标识别应用中计算复杂性较大且应用需求较广泛的行人检测识别与人脸检测识别进行重点研究。行人与人脸属于“非刚性目标”,与刚性目标不同,非刚性目标的轮廓是不规则且不断变化的,这不仅增加了计算的复杂性,也导致了对存储器数据访问模式的不规则性。
本文研究了基于主动形状模型(ActiveShape Model,ASM)的行人识别硬件加速技术。针对计算复杂性较大所造成的计算资源不足问题,为了实现硬件代价和处理速度的适当平衡,提出了资源共享模式和硬件流水线方式相互结合、灵活配置的计算资源映射策略,基本思想是对于占用较多计算资源的非瓶颈任务,采用资源共享模式,将多个相同类型的操作映射到一个功能部件上分时执行,多个操作的源操作数通过多路选择器进入功能部件的输入端口,通过采用优化的指令调度算法,最大程度的缩短了同一类型的不同操作之间的启动时间间隔;而对于计算复杂性较大的瓶颈任务,分配较多的计算资源,尽可能的采用流水线技术和其它并行策略提高处理速度。本文在FPGA上构建了原型系统,实现了行人的检测、识别与跟踪,实验结果表明,与相关工作相比具有较大的速度优势。
对于人脸目标,本文提出了一种精确分类的视角无关人脸检测方法,能够对垂直于图像平面±90度和图像平面内360度范围的所有人脸姿态进行快速准确地检测分类。树形检测器框架结构中的每个检测节点采用一种创新的两段式Boosting方法(Two-Stage Boosting,TS-Boosting)进行训练,核心思想是在判断一个样本是否属于某个姿态区间时,不仅要看该样本属于该姿态区间的概率有多大,还要看该样本不属于其它姿态区间的概率有多大。基于提出的算法,设计了硬件加速器,并提出了一种对硬件资源进行动态配置的设计空间探索算法。实验表明,本文提出的方法和硬件加速器与相关工作相比具有较高的检测准确率和处理速度。
本文最后针对行人、人脸检测识别等一类具有不规则数据访问模式的图像处理应用提出了一种通用无冲突并行访问存储模型,在主存储器与处理器之间构建了一种多体存储结构,并将大部分的不规则数据访问模式归类为对图像中多个局部矩形兴趣区域(RegionsofInterest,ROIs)内的任意位置固定大小矩形数据块的无冲突并行访问。理论分析与实验结果表明该存储模型与相关工作相比更适合于多兴趣区域图像处理应用,与直接访问主存储器相比在访存速度上提高了几倍到上百倍。
综上所述,本文面向目标检测识别应用,研究了使用硬件加速技术提高性能的关键技术,对算法并行特性分析、体系结构设计、计算和存储资源的灵活配置、面向不规则数据访问模式的并行存取模型等问题提出了有效的解决方案,对于推进目标检测识别技术的研究和实用化具有一定的意义和价值。
|
|
|
|
1 |
韩露;李祖枢;陈东义;;一种Java与OpenCV结合实现的目标检测模块[J];计算机应用;2008年03期 |
2 |
盛文,邓斌,柳健;一种基于多尺度距离像的红外小目标检测方法[J];电子学报;2002年01期 |
3 |
程进军,肖明清,谢希权;基于雷达和红外传感器的目标检测方法[J];传感器技术;2003年08期 |
4 |
黄祥,孙洪,罗玮,徐新,杨文;基于区域分类的智能恒虚警SAR图像目标检测[J];武汉大学学报(理学版);2004年01期 |
5 |
方学立;梁甸农;董臻;;目标检测性能的定量评估方法[J];系统工程与电子技术;2005年12期 |
6 |
黄琦兰;蒲明辉;;一种用于粒子场全息图像的目标检测新方法[J];激光与红外;2006年07期 |
7 |
李良翮;丁艳;;一种基于小波分析的小目标检测算法[J];光学技术;2006年S1期 |
8 |
何乃甩;黄席樾;刘俊;权循宝;;基于形态学重构的内河红外船舶目标检测[J];红外技术;2007年07期 |
9 |
李敏;彭进业;;运动目标检测中的边缘检测算法[J];延安大学学报(自然科学版);2008年01期 |
10 |
成兰;王志杰;姬琇荔;;基于图像局部特征的红外小目标检测与跟踪算法[J];红外技术;2008年06期 |
11 |
周箴毅;胡福乔;;基于背景建模的动态场景目标检测[J];计算机工程;2008年24期 |
12 |
王江安;吴荣华;康圣;宗思光;;复杂海空背景下红外弱小目标检测技术研究[J];光学与光电技术;2008年06期 |
13 |
王威;张鹏;高伟;王润生;;基于局部层次化混合高斯模型的视频序列运动目标检测[J];信号处理;2009年05期 |
14 |
曾孝平;陈礼;刘国金;谢春兰;朱斌;;视觉注意的图像目标预检测[J];重庆大学学报;2009年06期 |
15 |
马育锋;龚沈光;姜润翔;张凡;李松;;基于小波变换的目标信号检测方法[J];数据采集与处理;2009年06期 |
16 |
李颖宏;刘亚利;尹怡欣;庞一贵;;W~4理论在道路交叉口视频监测中的应用[J];计算机工程与应用;2010年04期 |
17 |
张建;关键;刘宁波;宋杰;;基于EMD和盒维数的固定微弱目标检测[J];信号处理;2010年04期 |
18 |
孙宁;翟尚礼;赵春光;;扫描型红外图像实时目标检测研究[J];中国图象图形学报;2011年04期 |
19 |
阎冬梅,曾峦,李生良;图象序列动目标检测[J];装备指挥技术学院学报;1997年01期 |
20 |
徐振海,王雪松,周颖,汪连栋,肖顺平,庄钊文;基于PWF融合的高分辨极化雷达目标检测算法[J];电子学报;2001年12期 |
|