收藏本站
收藏 | 论文排版

基于CPU+GPU的影像匹配高效能异构并行计算研究

肖汉  
【摘要】:多核CPU和图形处理器(Graphic Processing Unit, GPU)的高速发展,不但促进了图像处理、虚拟现实、计算机仿真等领域的快速发展,同时也为利用GPU进行图形处理以外的高性价比绿色通用计算提供了良好的运行平台。因此,GPU的通用计算己成为高性能计算领域中的热点研究课题之一。 伴随着传感器技术的不断进步,致使人们获取地表信息的手段越来越多样快捷。面对数据源的多样化与数据量的成倍增长,许多常规算法很难满足对海量数据进行高速计算的要求。而现代图形硬件GPU日益增加的可编程性和高效能计算能力,则为摄影测量与遥感中可并行化算法的加速提供很大的空间。本文仅就GPU大规模并行计算影像匹配研究中的若干问题进行了详细的分析,并提出了相应的解决方案。具体工作概述如下: (1)通过对摄影测量与遥感领域中与影像匹配处理相关的四种算法在GPU上的并行处理进行研究,提出了基于CPU+GPU的异构群核架构的影像处理共通解决方案,探索了影像处理的GPU大规模并行计算设计模式。基于GPU的影像处理通用并行解决方案要在数据精度、延迟和计算量等几个方面进行GPU加速效果的预评估,算法设计和优化过程中也须采用功能和数据分解、线程映射等并行计算方法以及存储器访问优化、通信优化和指令流优化等优化策略。基于GPU的影像处理通用解决方案设计与性能优化是与GPU的体系结构、求解问题的特征结合在一起的,通常需要多重因素整体考虑并不断尝试,最终达到理想的性能。针对GPU与CPU的不同,重点分析和讨论了GPU的加速原理以及当前比较成熟的统一计算设备架构(Compute Unified Device Architecture, CUDA)通用计算模型构架及其特点。 (2)提出多GPUs加速的Wallis变换影像增强并行算法。借助于GPU较强的运算能力,利用CUDA并行计算架构在个人计算机(Personal Computer, PC)上实现了快速Wallis图像滤波算法,包括GPU上任务分解、大规模计算核心的分解方法,结合使用了共享存储器、全局存储器对算法进行加速。使用线程块内的共享存储器较好地解决了同一计算子空间的各线程同步问题。对比CPU和GPU计算Wallis影像变换的时间,实验结果表明,Wallis变换并行算法可以把计算速度提高2个数量级。该方法具有较好的实时性,可大大提高图像增强过程的处理速度,显著地减少计算时间。 (3)研究基于GPU的Harris角点检测多设备控制并行算法,使用众多线程将计算中耗时的图像高斯卷积平滑滤波部分改造成单指令多线程(Single Instruction Multiple Thread, SIMT)模式,并采用GPU中共享存储器、常数存储器和锁页内存机制在CUDA上完成图像角点检测的全过程。实验结果表明,基于多GPUs的Harris角点检测并行算法成功实现了硬件加速,相对于CPU上运行的Harris角点检测算法,其执行效率有近60倍的提高。 (4)提出基于CUDA架构的快速相关系数影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法系根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化了数据存储结构,提高了数据访问效率。实验结果表明,并行算法充分利用了GPU的并行处理能力,速度是基于CPU实现的近20倍并能获得最高多处理器warp占有率。 (5)研究面向CPU+GPU群核架构的尺度不变特征变换(Scale Invariant Feature Transform, SIFT)特征匹配并行算法,优化了数据存储结构,提高了数据访问效率。实验结果表明,与SIFT特征匹配的串行CPU实现方式相比,CUDA实现能够实现超过27倍的性能加速,极大地提高了SIFT特征匹配算法在实际应用中的实时性。 (6)基于CPU+GPU的影像匹配系统集成研究。包括单GPU/多GPUs加速的Wallis-Harris-相关系数(WHR)影像匹配系统和单GPU/多GPUs加速的Wallis-SIFT(WS)影像匹配系统。实验结果表明,GPU加速的WHR影像匹配系统比CPU实现方法整体提速最高达37倍,GPU加速的WS影像匹配系统比CPU实现方法整体提速最高达39倍。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 石林;;关于CPU+GPU异构计算模式程序开发中编程方法研究[J];科学大众(科学教育);2014年10期
2 张庆强;蒋洋桥;成纪荣;;基于CPU+GPU的非线性编辑系统全面解析[J];中国有线电视;2006年14期
3 肖汉;李彩林;李琦;周清雷;;CPU+GPU异构并行的矩阵转置算法研究[J];东北师大学报(自然科学版);2019年04期
4 冯颖;袁庆华;沈健炜;;基于CPU+GPU异构计算的编程方法研究[J];通信技术;2011年02期
5 马召贵;赵改善;武港山;许自龙;段文超;王海波;;基于CPU+GPU联合计算真地表叠前时间偏移实用化研究[J];石油地球物理勘探;2014年03期
6 马永军;袁赢;李灏;;面向CPU+GPU异构平台的模板匹配目标识别并行算法[J];天津科技大学学报;2014年04期
7 阳王东;李肯立;;基于HYB格式稀疏矩阵与向量乘在CPU+GPU异构系统中的实现与优化[J];计算机工程与科学;2016年02期
8 笪敏;孟祥新;李霆;柳桃荣;;基于CPU+GPU混合架构的改进型距离徙动算法设计与实现[J];电子测量技术;2020年03期
9 王永胜;;CPU+GPU的异构计算系统在石油勘探中的应用研究[J];电脑知识与技术;2017年29期
10 邱浩淼;;基于CPU+GPU异构计算编程研究[J];科学技术创新;2020年01期
11 蔡镇河;张旭;栾江霞;;CPU+GPU异构模式下并行计算效率研究[J];计算机与现代化;2012年05期
12 阳王东;李肯立;;准对角矩阵与向量相乘在CPU+GPU异构集群上的实现与优化[J];小型微型计算机系统;2015年07期
13 许诺;许一凡;;基与CPU+GPU非编系统还原图像质量的主观评价[J];视听界(广播电视技术);2006年04期
14 乔保娟;李志山;曹胜涛;刘春明;侯晓武;杨志勇;;CPU+GPU并行计算技术在复杂结构非线性分析中的应用[J];建筑结构;2015年23期
15 姚鼎;曾国荪;丁春玲;;支持CPU+GPU协同计算的C源程序预处理划分策略[J];计算机应用;2013年S2期
中国博士学位论文全文数据库 前2条
1 肖汉;基于CPU+GPU的影像匹配高效能异构并行计算研究[D];武汉大学;2011年
2 阳王东;CPU+GPU异构平台上稀疏线性系统快速并行求解算法研究[D];湖南大学;2017年
中国硕士学位论文全文数据库 前19条
1 彭江锋;基于CPU+GPU异构平台的字符串匹配算法研究与实现[D];华南理工大学;2011年
2 宋浩;CPU+GPU异构环境下的大规模商品知识查询处理研究[D];桂林电子科技大学;2021年
3 吕向阳;基于CPU+GPU的图像处理异构并行计算研究[D];南昌大学;2014年
4 雷赫;基于CPU+GPU架构的机载多通道雷达海杂波建模仿真方法研究[D];西安电子科技大学;2020年
5 张建锋;基于CPU+GPU的外辐射源雷达信号处理技术研究[D];西安电子科技大学;2021年
6 张珮;基于CPU+GPU异构集群的量子计算仿真方法的研究[D];南京航空航天大学;2016年
7 董杨;基于CPU+GPU的雷达模拟训练系统软件设计[D];西安电子科技大学;2020年
8 万文;生物序列分析算法的CPU+GPU异构并行优化关键技术研究[D];国防科学技术大学;2012年
9 王瑞星;共轭梯度方法在CPU+GPU架构上的性能预估与高效实现[D];中国工程物理研究院;2017年
10 李芳芳;面向CPU+GPU集群的高哈特曼数磁流体三维数值模拟并行算法实现[D];杭州电子科技大学;2015年
11 梁正虹;CPU+GPU异构并行计算研究及其在可压缩流动中的应用[D];西南科技大学;2021年
12 杨迪;基于CPU+GPU异构信号处理平台多任务调度技术的研究[D];战略支援部队信息工程大学;2021年
13 马爱迪;基于CPU+GPU混合平台的HEVC并行解码器[D];大连理工大学;2017年
14 夏斌;基于CPU+GPU的外辐射源雷达自适应滤波算法实现技术[D];西安电子科技大学;2013年
15 李菲菲;基于CPU+GPU平台的实时视线跟踪系统[D];天津大学;2012年
16 苏学凯;基于CPU+GPU的H.264编码器并行编码设计[D];南京理工大学;2012年
17 闸旋;CPU+GPU单机异构环境下遥感数据并行处理技术研究[D];解放军信息工程大学;2013年
18 王晗;基于多核环境下的多线程并行程序设计方法研究[D];中原工学院;2014年
19 高伟;基于CPU+GPU桌面集群的人脸特征点实时检测系统研究[D];天津大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978