收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于CPU+GPU的影像匹配高效能异构并行计算研究

肖汉  
【摘要】:多核CPU和图形处理器(Graphic Processing Unit, GPU)的高速发展,不但促进了图像处理、虚拟现实、计算机仿真等领域的快速发展,同时也为利用GPU进行图形处理以外的高性价比绿色通用计算提供了良好的运行平台。因此,GPU的通用计算己成为高性能计算领域中的热点研究课题之一。 伴随着传感器技术的不断进步,致使人们获取地表信息的手段越来越多样快捷。面对数据源的多样化与数据量的成倍增长,许多常规算法很难满足对海量数据进行高速计算的要求。而现代图形硬件GPU日益增加的可编程性和高效能计算能力,则为摄影测量与遥感中可并行化算法的加速提供很大的空间。本文仅就GPU大规模并行计算影像匹配研究中的若干问题进行了详细的分析,并提出了相应的解决方案。具体工作概述如下: (1)通过对摄影测量与遥感领域中与影像匹配处理相关的四种算法在GPU上的并行处理进行研究,提出了基于CPU+GPU的异构群核架构的影像处理共通解决方案,探索了影像处理的GPU大规模并行计算设计模式。基于GPU的影像处理通用并行解决方案要在数据精度、延迟和计算量等几个方面进行GPU加速效果的预评估,算法设计和优化过程中也须采用功能和数据分解、线程映射等并行计算方法以及存储器访问优化、通信优化和指令流优化等优化策略。基于GPU的影像处理通用解决方案设计与性能优化是与GPU的体系结构、求解问题的特征结合在一起的,通常需要多重因素整体考虑并不断尝试,最终达到理想的性能。针对GPU与CPU的不同,重点分析和讨论了GPU的加速原理以及当前比较成熟的统一计算设备架构(Compute Unified Device Architecture, CUDA)通用计算模型构架及其特点。 (2)提出多GPUs加速的Wallis变换影像增强并行算法。借助于GPU较强的运算能力,利用CUDA并行计算架构在个人计算机(Personal Computer, PC)上实现了快速Wallis图像滤波算法,包括GPU上任务分解、大规模计算核心的分解方法,结合使用了共享存储器、全局存储器对算法进行加速。使用线程块内的共享存储器较好地解决了同一计算子空间的各线程同步问题。对比CPU和GPU计算Wallis影像变换的时间,实验结果表明,Wallis变换并行算法可以把计算速度提高2个数量级。该方法具有较好的实时性,可大大提高图像增强过程的处理速度,显著地减少计算时间。 (3)研究基于GPU的Harris角点检测多设备控制并行算法,使用众多线程将计算中耗时的图像高斯卷积平滑滤波部分改造成单指令多线程(Single Instruction Multiple Thread, SIMT)模式,并采用GPU中共享存储器、常数存储器和锁页内存机制在CUDA上完成图像角点检测的全过程。实验结果表明,基于多GPUs的Harris角点检测并行算法成功实现了硬件加速,相对于CPU上运行的Harris角点检测算法,其执行效率有近60倍的提高。 (4)提出基于CUDA架构的快速相关系数影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法系根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化了数据存储结构,提高了数据访问效率。实验结果表明,并行算法充分利用了GPU的并行处理能力,速度是基于CPU实现的近20倍并能获得最高多处理器warp占有率。 (5)研究面向CPU+GPU群核架构的尺度不变特征变换(Scale Invariant Feature Transform, SIFT)特征匹配并行算法,优化了数据存储结构,提高了数据访问效率。实验结果表明,与SIFT特征匹配的串行CPU实现方式相比,CUDA实现能够实现超过27倍的性能加速,极大地提高了SIFT特征匹配算法在实际应用中的实时性。 (6)基于CPU+GPU的影像匹配系统集成研究。包括单GPU/多GPUs加速的Wallis-Harris-相关系数(WHR)影像匹配系统和单GPU/多GPUs加速的Wallis-SIFT(WS)影像匹配系统。实验结果表明,GPU加速的WHR影像匹配系统比CPU实现方法整体提速最高达37倍,GPU加速的WS影像匹配系统比CPU实现方法整体提速最高达39倍。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 谢茂涛;计算机数字逻辑器件故障分析[J];鄂州大学学报;1999年03期
2 陈一鸣;I~2C总线技术在彩电中的应用[J];浙江万里学院学报;2002年01期
3 王楠,高庆狮,侯紫峰,宋建平;一种高安全性的新型存储体系[J];计算机研究与发展;2004年05期
4 宗军红,王春生,孔令旭,景素霞,胡宪锋;数据库物理设计需注意的几点问题[J];油气田地面工程;2002年02期
5 田春仿;微电脑控制系统的剖析方法[J];武汉理工大学学报(信息与管理工程版);2002年02期
6 杨晓红;微机的散热分析[J];高等职业教育-天津职业大学学报;2002年05期
7 孙峻岭;智能感温火灾探测器的低功耗设计[J];安徽电子信息职业技术学院学报;2004年02期
8 林昱;主板技术的新发展[J];北京联合大学学报;2001年02期
9 苏阳;软件的抗干扰技术软件[J];信息技术与标准化;2002年03期
10 张春玲;《汇编语言程序设计》教学难点解析[J];河北广播电视大学学报;2002年03期
11 薛一鸣;GIDC-C密码算法芯片的研制与开发[J];中国农业大学学报;2003年04期
12 刘连浩,王晓玲,罗桂娥,王桥医;《单片机原理及应用》教学改革的探讨[J];湖南工业职业技术学院学报;2003年04期
13 莫德举 ,朱大雷,吴天文;多变量涡街变送器的研究[J];测控技术;2001年11期
14 刘键,栾元迪,张杰;工程设计中集散控制系统(DCS)的选型[J];山东冶金;2001年04期
15 武红军;单片机在变压器差动保护装置中的应用[J];微型电脑应用;2000年08期
16 蒋彤;程控交换机中的中央处理器单元[J];计算机与网络;2001年20期
17 吴军辉 ,林开颜 ,徐立鸿;MC14562B在多CPU系统串行通信中的应用[J];微型机与应用;2002年06期
18 陈晓,范成法,过仕好;数据交换网络设备的CPU负载分析[J];电信技术;2004年08期
19 刘利成;兼容机常用主板结构和性能[J];电脑知识与技术;1994年03期
20 吴军,曹力,李晓瑞;微型计算机常用总线结构比较[J];鞍山钢铁学院学报;1998年03期
中国重要会议论文全文数据库 前10条
1 李全钢;张芳;宋振兴;;基于CPU卡的一卡通系统在宣钢2#服务区的应用[A];2011年河北省冶金信息化自动化年会论文集[C];2011年
2 邹云鹏;康雁;;基于CPU的光线投射算法的并行计算方法[A];中国生物医学工程学会成立30周年纪念大会暨2010中国生物医学工程学会学术大会青年优秀论文[C];2010年
3 耿则勋;;影像匹配中核线影像的快速生成算法[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年
4 李求实;王秋月;王珊;;平衡IO和CPU的XML关键词检索技术[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
5 胡益新;奚永新;;基于双32位CPU的电除尘控制器的设计[A];第十四届中国电除尘学术会议论文集[C];2011年
6 张永生;范永弘;;带特征约束的城市区域大比例影像匹配算法的研究[A];中国空间科学学会空间探测专业委员会第十三次学术会议论文集[C];2000年
7 罗宗扬;薛利兴;左德承;张展;杨孝宗;;基于JTAG的CPU故障注入工具的设计与实现[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
8 叶勤;陈鹰;;图像压缩对影像匹配精度影响的研究[A];第十三届全国遥感技术学术交流会论文摘要集[C];2001年
9 李乃强;宋小虎;;最小二乘影像匹配的实现和分析[A];江苏省测绘学会2007年学术年会论文集[C];2008年
10 李乃强;宋小虎;;最小二乘影像匹配的实现和分析[A];江苏省测绘学会2007'学术年会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 肖汉;基于CPU+GPU的影像匹配高效能异构并行计算研究[D];武汉大学;2011年
2 葛海通;32位高性能嵌入式CPU及平台研发[D];浙江大学;2009年
3 朱二周;基于CPU/GPU平台的虚拟化技术研究[D];上海交通大学;2012年
4 王明宇;低功耗双界面CPU智能卡芯片的研究与设计[D];复旦大学;2011年
5 王宇宙;计算机视觉三维重建理论与应用[D];西北大学;2004年
6 李波;基于异构多核平台的优化编程研究[D];华中科技大学;2011年
7 郑丹丹;嵌入式CPU的纳米尺度SRAM设计研究[D];浙江大学;2009年
8 赵杰;数字地形模拟—地形数据获取与数字地形分析研究[D];武汉大学;2004年
9 季铮;近景目标三维重建的自动化方法研究[D];武汉大学;2007年
10 明洋;特殊航空影像自动匹配的关键技术研究[D];武汉大学;2009年
中国硕士学位论文全文数据库 前10条
1 徐连军;双CPU冗余通信控制系统的研究与实现[D];西安电子科技大学;2011年
2 林守林;基于CPU利用率的功率调整策略的研究与实现[D];中国地质大学(北京);2010年
3 冯元华;嵌入式多CPU控制器硬件体系分析与设计[D];暨南大学;2010年
4 徐峰;双界面CPU智能卡并行测试仪设计开发[D];复旦大学;2011年
5 奥飚;运用CPU卡的电力收费系统中密钥管理系统的安全性研究与设计[D];华北电力大学(北京);2011年
6 范晓亮;基于FPGA的双核模型机CPU的设计与实现[D];东北大学;2008年
7 胡杰;CPU-GPU异构平台计算模型的研究与应用[D];大连理工大学;2011年
8 成思远;异构(CPU-GPU)计算机系统性能评测与优化技术研究[D];国防科学技术大学;2011年
9 严宇波;无人机摄影测量影像匹配与纠正技术研究[D];沈阳航空航天大学;2013年
10 谢萌;针对Multi-core CPU和General Purpose GPU在MATLAB下微分方程常用算法的优化[D];河北科技大学;2012年
中国重要报纸全文数据库 前10条
1 本报记者 汤铭;CPU:迎接融合时代[N];计算机世界;2011年
2 苏州国芯科技有限公司董事长 郑茳;打开国产嵌入式CPU应用之路[N];中国电子报;2011年
3 重庆 陈静;移动CPU大跃进性能竞赛引担忧[N];电脑报;2011年
4 本报记者 刘肖勇;网络蓝军:一块CPU,就是一架轰炸机[N];广东科技报;2011年
5 刘清;税务总局严打虚假出口CPU骗取退税行为[N];中国贸易报;2009年
6 何雨欣 李延霞;税务总局:严打虚假出口CPU骗税行为[N];中国企业报;2009年
7 上海硅知识产权交易中心 俞慧月;中国须尽早确定CPU专利对策[N];中国电子报;2009年
8 黑龙江 高林;彩电CPU故障的分析与速修两例[N];电子报;2011年
9 记者 孙勇;税务总局严打虚假出口CPU骗税行为[N];经济日报;2009年
10 本报记者 刘丽丽;浪潮 推新服务器 国产CPU市场化启程[N];计算机世界;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978