收藏本站
《中国气象科学研究院》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于GPGPU系统的GRAPES-GLOBAL长波辐射过程并行设计与优化

郭妙  
【摘要】:随着通用图形处理器(GPGPU)计算技术的快速发展,通过大规模增加处理系统的并发度来提升性能成为计算机高性能计算的最新趋势。目前,通用图形处理器已经被应用到科学计算的诸多领域。长波辐射作为GRAPES模式中极为重要的物理过程,其巨大的计算量对整个GRAPES模式的运行效率有着重要影响。本文依托英伟达公司计算统一设备架构(NVIDIA CUDA)技术平台,以GRAPES全球模式中长波辐射传输方案为例,对其进行了大规模并发设计和优化,针对程序特点设计出的不同于MPI粗粒度并行的线程级细粒度并行方案,分别在Tesla C1060显卡和Tesla C2050显卡上作了对比试验。 对比MPI粗粒度并行方案,线程级细粒度并行方案的优点主要有以下三点:a)并发度增加。b)充分利用大的显存带宽。c)计算和通信密度增加,提升效率。GPGPU的计算能力具有针对性,具有以下特点:大量的平行数据与计算,较少的逻辑分支判断等。这些计算特点与数值天气预报模式数据密集,计算量大、且高度并行的特点相吻合。因此,将GPGPU技术运用于数值天气预报模式的运行中是可行的。 初步试验结果显示,在保持系统结果一致的前提下,如果只计算GPGPU的计算用时,对比单颗高端CPU,Tesla C1060GPGPU具有11倍的加速效果;Tesla C2050GPGPU具有13倍的加速效果。而如果计算数据传输和GPGPU计算总耗时的话,Tesla C1060GPGPU和Tesla C2050GPGPU的总加速分别为5.9和6.1倍。 对并行结果做深入分析后发现,基于通用图形处理器的多线程并行在不超过硬件限制的条件下,线程数量越多,速度越快,增加模式的并发度与GPGPU系统的占用率有利于发挥GPGPU的性能。基于通用图形处理器的GRAPES全球模式中长波辐射并行方案有良好的加速效果,但通过分析发现CPU与GPGPU间的数据传输耗时非常大,会消耗由通用图形处理器的计算能力带来的优势,是GPGPU并行试验中的最大瓶颈。 最后针对程序特点,采用异步执行方法来隐藏数据传输延迟。异步执行允许GPGPU的操作(内核启动或者异步存储器拷贝函数)从CPU端启动后,在GPU真正完成这些操作之前,在CPU端就可以得到这些函数的返回值,CPU线程就可以继续下一步操作。通过异步函数,CPU可以在GPGPU端进行运算或者数据传输的同时进行其他操作,更加有效地利用系统中的计算资源。本试验中运用多个流的异步执行方法来隐藏数据传输用时的方案取得了可观的加速效果,最后的总加速是原模式CPU方案的8.97倍,明显提升了GRAPES全球模式的执行速度和预报时效。本研究表明,使用GPGPU技术提升数值预报模式的执行速度是可行的,也是非常有潜力的。
【学位授予单位】:中国气象科学研究院
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:P409

【相似文献】
中国期刊全文数据库 前10条
1 任军学;李娟;仇钎;汤海滨;温正;;离子发动机交换电荷离子返流的粒子模拟[J];强激光与粒子束;2011年07期
2 杨靖宇;张永生;李正国;龚辉;;遥感影像正射纠正的GPU-CPU协同处理研究[J];武汉大学学报(信息科学版);2011年09期
3 徐安伦;杨艳军;孙绩华;刘劲松;李万虎;;大理地区晚霜冻灾害前后大气边界层特征分析[J];气象科技;2011年04期
4 ;地球环境在变暖——温室效应[J];青苹果;2005年01期
5 李欣;杨修群;汤剑平;孙旭光;房佳蓓;;WRF/NCAR模拟的夏季长三角城市群区域多城市热岛和地表能量平衡[J];气象科学;2011年04期
6 王丽萍;潘伟;;一种无特征提取的自然场景图像分类新方法[J];厦门大学学报(自然科学版);2011年04期
7 孙善磊;周锁铨;宋洁;石建红;顾人颖;黄珏;;应用Penman公式对江西省太阳总辐射变化特征的探讨[J];气候与环境研究;2011年05期
8 田园;万毅;;基于CUDA的并行碰撞检测算法研究[J];甘肃科技;2011年14期
9 康富贵;李耀辉;;近10a西北地区沙尘气溶胶研究综述[J];干旱气象;2011年02期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 熊攀;;小波极大值图示法在长波辐射数据信息提取中的应用[A];中国地震学会空间对地观测专业委员会2009年学术研讨会论文摘要集[C];2009年
2 郭晓;张元生;沈文荣;;汶川地震前后长波辐射信息的变化特征[A];中国地球物理2010——中国地球物理学会第二十六届年会、中国地震学会第十三次学术大会论文集[C];2010年
3 荆凤;申旭辉;康春丽;孟庆岩;熊攀;;中国大陆地区卫星长波辐射背景场特征初步分析及震例研究[A];中国地震学会空间对地观测专业委员会成立大会暨学术研讨会论文集[C];2008年
4 荆凤;康春丽;熊攀;陈杨;;基于涡度背景场的长波辐射地震异常提取方法[A];中国地震学会空间对地观测专业委员会2009年学术研讨会论文摘要集[C];2009年
5 熊攀;申旭辉;毕亚新;康春丽;荆凤;;小波极大值法在长波辐射地震异常信息提取中的应用[A];中国地震学会空间对地观测专业委员会成立大会暨学术研讨会论文集[C];2008年
6 郭晓;张元生;魏从信;钟美娇;沈文荣;;中国大陆中强地震长波辐射信息变化特征[A];中国地震学会第14次学术大会专题[C];2012年
7 周国亮;冯海军;何国明;陈红;李翠平;王珊;;基于图形处理器的Cuboid算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 荆凤;申旭辉;康春丽;孙珂;熊攀;;长波辐射短期及临震地震信息提取方法及震例分析[A];中国地球物理学会第二十七届年会论文集[C];2011年
9 胡玉峰;刘钧;白素莲;马剑;陈志娟;;HTL-2长波辐射表的研制[A];中国气象学会2006年年会“提高大气监测自动化水平、为业务技术体制改革作贡献”分会场论文集[C];2006年
10 张春燕;;一种基于图形处理器的数据流计算模式[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
中国重要报纸全文数据库 前10条
1 ;NEC图形处理器每秒运行50.2G条指令[N];计算机世界;2003年
2 乐山 乐水;图形处理技术的全球专利布局形势[N];中国知识产权报;2010年
3 游讯;图形处理器GPU[N];人民邮电;2011年
4 乐天 编译;混合CPU更节能[N];计算机世界;2009年
5 石俊霞;温室气体及其危害[N];科学导报;2005年
6 谢征;苹果新款iMac采用NVIDIA技术[N];中国计算机报;2002年
7 本报记者 霍光;DX11助推GPU进一步革新[N];中国计算机报;2009年
8 本报记者 张学琦;CPU+GPU引领未来HPC架构[N];中国电子报;2009年
9 商报记者 吴辰光;威盛电子三大领域全方位布局[N];北京商报;2010年
10 霍光;NVIDIA MCP7A MGPU[N];中国计算机报;2008年
中国博士学位论文全文数据库 前10条
1 朱玥;Tile-Based图形处理方法及高质量图形算法设计[D];中国科学技术大学;2012年
2 夏健明;基于图形处理器的大规模结构计算研究[D];华南理工大学;2009年
3 曹锋;数据流聚类分析算法[D];复旦大学;2006年
4 任鸿翔;航海模拟器中基于GPU的海洋场景真实感绘制[D];大连海事大学;2009年
5 杨毅;面向移动设备的真实感图形处理系统设计与实现[D];中国科学技术大学;2008年
6 李蔚清;分布式仿真系统中的虚拟环境生成技术研究[D];南京理工大学;2007年
7 林一松;面向GPU的低功耗软件优化关键技术研究[D];国防科学技术大学;2012年
8 刘瑜;FDTD算法的网络并行研究及其电磁应用[D];电子科技大学;2008年
9 杜莹;全球多分辨率虚拟地形环境关键技术的研究[D];中国人民解放军信息工程大学;2005年
10 杨珂;基于图形处理器的数据管理技术研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 郭妙;基于GPGPU系统的GRAPES-GLOBAL长波辐射过程并行设计与优化[D];中国气象科学研究院;2012年
2 黄伟钿;面向移动平台的3D图形处理器的设计[D];华南理工大学;2011年
3 杨国东;嵌入式图形处理器的研究与实现[D];山东大学;2010年
4 杨彬;基于图形处理器的合成孔径雷达成像算法[D];上海交通大学;2010年
5 谭显强;基于FPGA的3D图形处理器IP核的设计与实现[D];南京航空航天大学;2010年
6 陈杨;地震红外遥感异常特征综合研究[D];中国地震局地震预测研究所;2011年
7 陈韬;基于多图形处理器的高效波动声学模拟器及其应用[D];浙江大学;2012年
8 林江;GPU流式计算模型应用研究[D];浙江大学;2011年
9 冯伟;基于GPU并行运算的实时视频增强研究[D];南京大学;2012年
10 杨杰;基于多源遥感数据地震前热异常分析[D];长安大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026