收藏本站
《国防科学技术大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

面向大规模科学计算的CPU-GPU异构并行技术研究

方旭东  
【摘要】: 大规模科学计算对科学研究具有及其重要的意义,是计算机学科面临的重大任务。近年来,随着GPU硬件及其编程模型的快速发展,使用GPU来加速大规模科学计算应用已成为必然趋势。GPU擅长进行计算密集型操作,而且具有极高的性价比,非常适合高性能科学计算。然而,如何有效地把科学计算应用移植到GPU上运行仍是一个很大的挑战。在由CPU和GPU构建的异构系统中,CPU负责进行复杂的逻辑运算和事务管理等不适合数据并行的计算,GPU负责进行计算密集度高、逻辑分支简单的大规模数据计算。本文从两个层面研究了面向大规模科学计算的CPU-GPU异构并行技术。首先,根据CPU-GPU异构平台的特性,本文提出了CPU-GPU任务划分和CPU-GPU间通信优化两种优化策略。在讨论任务划分时,本文给出了比例划分法、曲线拟合法和搜索法三种任务划分模型,各自适用用于不同的情况;在研究CPU-GPU间数据通信时,本文提出了中间结果复用和长流分段两种方法,从不同角度优化CPU-GPU的通信过程。其次,针对AMD GPU硬件及其编程模型Brook+的特性,本文提出了四种面向GPU的并行优化策略,包括平衡线程并行性和局部性、分支消除、开发指令级并行和提高访存带宽利用率。本文选取了矩阵乘、LU分解和Mgrid三个重要的科学计算程序,把它们移植到AMD GPU上运行,并使用本文提出的优化策略对各个程序进行了优化。经测试后发现,这三个程序的性能都得到了很大提升,说明本文提出的异构并行优化技术是非常有效的。本文的工作对在CPU-GPU异构平台上开发和优化科学计算应用具有一定的指导意义。
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP338.6

免费申请
【引证文献】
中国期刊全文数据库 前3条
1 杨芳菊;;基于CPU/GPU异构平台并行优化的研究[J];电脑编程技巧与维护;2012年18期
2 卢风顺;宋君强;银福康;张理论;;CPU/GPU协同并行计算研究综述[J];计算机科学;2011年03期
3 雷秀丽;张婷;赵洋;冯景华;徐斌;孟祥飞;朱小谦;;“天河一号”大规模科学与工程计算应用[J];计算机工程与科学;2012年08期
中国硕士学位论文全文数据库 前5条
1 赵进;基于GPU的遥感图像并行处理算法及其优化技术研究[D];国防科学技术大学;2011年
2 石志才;异构平台上协同计算的相关研究[D];国防科学技术大学;2011年
3 胡杰;CPU-GPU异构平台计算模型的研究与应用[D];大连理工大学;2011年
4 林乐森;基于OpenCL的AES算法并行性分析及加速方案[D];吉林大学;2012年
5 昝济国;基于GPU加速的自适应波束形成SMI算法的设计与实现[D];西安电子科技大学;2012年
【参考文献】
中国期刊全文数据库 前2条
1 吴恩华,柳有权;基于图形处理器(GPU)的通用计算[J];计算机辅助设计与图形学学报;2004年05期
2 吴恩华;图形处理器用于通用计算的技术、现状及其挑战[J];软件学报;2004年10期
【共引文献】
中国期刊全文数据库 前10条
1 徐品;蓝善祯;刘兰兰;;利用GPU进行通用数值计算的研究[J];中国传媒大学学报(自然科学版);2009年02期
2 李立新;叶剑;余洋;;基于GPU的MD6算法快速实现[J];北京工业大学学报;2010年05期
3 陈红倩;李凤霞;黄天羽;战守义;;一种基于动态纹理的运动场景可视化方法[J];北京理工大学学报;2009年06期
4 李伟伟;王健;陈轶;王钲旋;;火焰实时模拟的新算法[J];吉林大学学报(信息科学版);2008年06期
5 杨靖宇;张永生;张宏兰;纪松;;基于可编程图形硬件的遥感影像并行处理研究[J];测绘工程;2008年03期
6 杨靖宇;张永生;董广军;;基于GPU的遥感影像SAM分类算法并行化研究[J];测绘科学;2010年03期
7 刘昆;王晓斌;廖成;;图形处理器(GPU)加速时域有限元的二维辐射计算[J];电波科学学报;2008年01期
8 黄玉龙;刘明波;;应用图形处理器实现无功优化并行计算[J];电工技术学报;2011年11期
9 李建明;万单领;何荣盛;钱昆明;;一种基于GPU加速的图像颜色传递算法[J];大连理工大学学报;2008年02期
10 王梦雪;陶卫;杨金峰;吴芳;赵辉;王卫东;任盛伟;;基于GPU的高速铁路扣件实时探测技术[J];大连交通大学学报;2011年06期
中国重要会议论文全文数据库 前10条
1 刘伟峰;唐先明;韩宝东;朱文妹;;基于GPU计算的光线投射法体绘制研究[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
2 李瑞瑞;高小鹏;龙翔;;用GPU加速Cache模拟[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 李蔚清;苏智勇;杨正龙;吴慧中;;一种复杂目标RCS估计的快速仿真方法[A];2007系统仿真技术及其应用学术会议论文集[C];2007年
4 任鸿翔;金一丞;尹勇;;基于GPU的多重凹凸贴图方法[A];2007系统仿真技术及其应用学术会议论文集[C];2007年
5 陈琰;高月芳;朱同林;;基于顶点属性的三维网格模型混合平滑算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 罗月童;薛晔;刘晓平;;基于GPU的多分辨率体数据重构技术研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 谢文军;陈皓;刘晓平;;基于GPU的实时水面模拟方法研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
8 张春燕;;一种基于图形处理器的数据流计算模式[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
9 陈皓;刘晓平;;基于投影距离的改进软阴影生成算法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
10 林旭生;田绪红;冯志炜;陈茂资;;GPU加速的蚁群算法在HP模型中的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 李敏;基于协同异构模型的成形模拟计算加速[D];华中科技大学;2010年
2 吴锋;基于GPU并行计算的数值模拟与燃煤锅炉系统的优化研究[D];浙江大学;2010年
3 杨超;虚拟战场中电磁环境三维建模与绘制方法研究[D];国防科学技术大学;2010年
4 张帆;基于MPI和GPU直流电法和大地电磁法三维正演的并行算法研究[D];中国地质大学(北京);2011年
5 郑元满;重磁三维物性实时可视化反演关键技术研究[D];中国地质大学(北京);2011年
6 徐晓旸;三维虚拟展馆中的光照技术研究[D];南京大学;2011年
7 马安国;高效能GPGPU体系结构关键技术研究[D];国防科学技术大学;2011年
8 陈永健;基于内容的大规模图像检索关键技术研究[D];华中科技大学;2011年
9 韦虎;三维外形测量系统中的数据处理关键技术研究[D];南京航空航天大学;2010年
10 唐滔;面向CPU-GPU异构并行系统的编程模型与编译优化关键技术研究[D];国防科学技术大学;2012年
中国硕士学位论文全文数据库 前10条
1 韩君;近期数据流频繁项集挖掘[D];大连理工大学;2010年
2 魏卓群;GPU并行免疫算法在冷轧生产调度中的应用[D];大连理工大学;2010年
3 卢晓伟;基于GPU的数据流处理方法研究[D];大连理工大学;2010年
4 梁霞;基于GPU的H.264并行解码器设计[D];大连理工大学;2010年
5 吕艳;反走样技术和滤波技术在地图可视化表达中的应用[D];辽宁工程技术大学;2009年
6 付浩生;交互式海洋动漫平台场景特效制作[D];中国海洋大学;2010年
7 戚明渊;基于多模纹理分类的图像隐写分析算法[D];华东理工大学;2011年
8 王涛;基于GPU的程序分析与并行化研究[D];解放军信息工程大学;2010年
9 姜晓希;视频内容敏感的动态字幕添加[D];浙江大学;2010年
10 王雷;基于GPU的椭圆曲线相关算法并行化效率分析[D];解放军信息工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 骆寒冰;徐慧;余建星;万正权;;舰船砰击载荷及结构动响应研究综述[J];船舶力学;2010年04期
2 赵书河,张新明,曲鸿建;多光谱遥感影像与高分辨率全色影像融合研究[J];测绘信息与工程;2004年05期
3 徐晓飞;曹祥玉;姚旭;陈盼;;一种基于Doolittle LU分解的线性方程组并行求解方法[J];电子与信息学报;2010年08期
4 杨鹏飞;;GPON网络结构及其安全性分析[J];信息通信;2007年03期
5 张朝晖;刘俊起;徐勤建;;GPU并行计算技术分析与应用[J];信息技术;2009年11期
6 ;Multi-scale HPC system for multi-scale discrete simulation—Development and application of a supercomputer with 1 Petaflops peak performance in single precision[J];Particuology;2009年04期
7 曹小林;张爱清;莫则尧;;基于面向对象的粒子类模拟并行计算研究[J];计算机研究与发展;2007年10期
8 陈华平 ;黄刘生 ;安虹 ;陈国良;;并行分布计算中的任务调度及其分类[J];计算机科学;2001年01期
9 卢风顺;宋君强;银福康;张理论;;CPU/GPU协同并行计算研究综述[J];计算机科学;2011年03期
10 程豪;张云泉;张先轶;李玉成;;CPU-GPU并行矩阵乘法的实现与性能分析[J];计算机工程;2010年13期
中国博士学位论文全文数据库 前3条
1 马安国;高效能GPGPU体系结构关键技术研究[D];国防科学技术大学;2011年
2 邓鹍;前瞻多线程编译优化技术的研究与实现[D];国防科学技术大学;2001年
3 周海芳;遥感图像并行处理算法的研究与应用[D];国防科学技术大学;2003年
中国硕士学位论文全文数据库 前10条
1 郭晓光;基于电视伴音的外辐射源雷达信号处理工程实现技术[D];西安电子科技大学;2011年
2 林其选;基于GPU加速的光子映射技术研究[D];杭州电子科技大学;2009年
3 张灿峰;高性能遥感图像融合算法研究与实现[D];国防科学技术大学;2010年
4 何锐;GPGPU多核流体系结构与功耗模拟研究[D];国防科学技术大学;2010年
5 银福康;GPS掩星资料处理的GPU并行算法研究[D];国防科学技术大学;2010年
6 苏华友;基于CUDA的H.264并行编码器研究与实现[D];国防科学技术大学;2010年
7 张倩;CUDA平台上序列比对并行软件的优化[D];中国科学技术大学;2011年
8 许家安;自适应波束形成算法及外辐射源雷达威力分析[D];南京理工大学;2005年
9 金海江;分布式数据库加密技术的研究与实现[D];南京理工大学;2007年
10 杨洋;游戏引擎中非真实感渲染的研究与实现[D];电子科技大学;2008年
【二级引证文献】
中国期刊全文数据库 前8条
1 王加亮;秦勃;刘健健;刘妮;;基于MapReduce的交互可视化平台[J];电信科学;2012年09期
2 杨芳菊;;基于CPU/GPU异构平台并行优化的研究[J];电脑编程技巧与维护;2012年18期
3 刘军志;朱阿兴;秦承志;陈腊娇;吴辉;江净超;;分布式水文模型的并行计算研究进展[J];地理科学进展;2013年04期
4 邢星星;赵国兴;骆祖莹;方浩;;基于GPU的全源最短路径算法[J];计算机科学;2012年03期
5 刘勇;赵秦德;赖正文;黄东平;王璟星;;异构平台上多维线性哈希的研究[J];计算机科学;2012年10期
6 孙延维;张慧;;基于GPU的串匹配算法研究综述[J];湖北第二师范学院学报;2012年08期
7 于飞;吉庆兵;罗顺;张李军;兰天;;GPU计算及其在密码分析中的应用[J];信息安全与通信保密;2012年12期
8 郑毅;郑苹;;增强现实光照方向估计方法评述与展望[J];智能系统学报;2012年05期
中国重要会议论文全文数据库 前1条
1 ;Research on DSP-GPU Heterogeneous Computing System[A];Information Technology and Computer Science—Proceedings of 2012 National Conference on Information Technology and Computer Science[C];2012年
中国硕士学位论文全文数据库 前10条
1 杨博;深穿透粒子输运蒙特卡罗模拟的CPU/GPU协同算法研究[D];国防科学技术大学;2011年
2 石志才;异构平台上协同计算的相关研究[D];国防科学技术大学;2011年
3 王翔;球谐函数展开快速算法及其并行算法研究[D];国防科学技术大学;2011年
4 吕东川;基于并行计算的脑电信号分析方法研究[D];燕山大学;2012年
5 栗超;一种三维可视化系统的优化策略[D];燕山大学;2012年
6 刁兴光;独立成分算法在GPU上的实现[D];大连理工大学;2012年
7 赵琳琳;非均匀地层随钻电磁波测井电磁响应的研究[D];山东大学;2012年
8 李国栋;基于异构计算平台的列数据库并行查询技术研究与实现[D];华南理工大学;2012年
9 沈玉琳;通用GPU计算技术在高性能计算平台上的应用研究[D];兰州大学;2012年
10 周智强;基于图像融合和模糊聚类的SAR图像变化检测[D];西安电子科技大学;2012年
【二级参考文献】
中国期刊全文数据库 前1条
1 吴恩华,柳有权;基于图形处理器(GPU)的通用计算[J];计算机辅助设计与图形学学报;2004年05期
【相似文献】
中国期刊全文数据库 前10条
1 谢茂涛;计算机数字逻辑器件故障分析[J];鄂州大学学报;1999年03期
2 陈一鸣;I~2C总线技术在彩电中的应用[J];浙江万里学院学报;2002年01期
3 王楠,高庆狮,侯紫峰,宋建平;一种高安全性的新型存储体系[J];计算机研究与发展;2004年05期
4 宗军红,王春生,孔令旭,景素霞,胡宪锋;数据库物理设计需注意的几点问题[J];油气田地面工程;2002年02期
5 田春仿;微电脑控制系统的剖析方法[J];武汉理工大学学报(信息与管理工程版);2002年02期
6 杨晓红;微机的散热分析[J];高等职业教育-天津职业大学学报;2002年05期
7 孙峻岭;智能感温火灾探测器的低功耗设计[J];安徽电子信息职业技术学院学报;2004年02期
8 林昱;主板技术的新发展[J];北京联合大学学报;2001年02期
9 苏阳;软件的抗干扰技术软件[J];信息技术与标准化;2002年03期
10 张春玲;《汇编语言程序设计》教学难点解析[J];河北广播电视大学学报;2002年03期
中国重要会议论文全文数据库 前10条
1 李全钢;张芳;宋振兴;;基于CPU卡的一卡通系统在宣钢2#服务区的应用[A];2011年河北省冶金信息化自动化年会论文集[C];2011年
2 邹云鹏;康雁;;基于CPU的光线投射算法的并行计算方法[A];中国生物医学工程学会成立30周年纪念大会暨2010中国生物医学工程学会学术大会青年优秀论文[C];2010年
3 李求实;王秋月;王珊;;平衡IO和CPU的XML关键词检索技术[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
4 胡益新;奚永新;;基于双32位CPU的电除尘控制器的设计[A];第十四届中国电除尘学术会议论文集[C];2011年
5 罗宗扬;薛利兴;左德承;张展;杨孝宗;;基于JTAG的CPU故障注入工具的设计与实现[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
6 赵朝霞;;浅论梅山2~#石灰竖窑控制系统[A];第十一届全国自动化应用技术学术交流会论文集[C];2006年
7 樊番;;PLC与智能从站之间的通讯[A];2008年全国轧钢生产技术会议文集[C];2008年
8 樊番;;PLC与智能从站之间的通讯[A];2008年河北省轧钢技术与学术年会论文集(下)[C];2008年
9 谢卫才;林友杰;彭磊;谢澍;;基于双CPU的电机节能控制[A];第十六届中国小电机技术研讨会论文摘要集[C];2011年
10 高鸿钧;马立平;杨清传;陈慧英;薛增泉;庞世谨;;有机聚合物CPU的结构形态[A];第四届全国STM学术会议论文集[C];1996年
中国重要报纸全文数据库 前10条
1 本报记者 汤铭;CPU:迎接融合时代[N];计算机世界;2011年
2 苏州国芯科技有限公司董事长 郑茳;打开国产嵌入式CPU应用之路[N];中国电子报;2011年
3 重庆 陈静;移动CPU大跃进性能竞赛引担忧[N];电脑报;2011年
4 本报记者 刘肖勇;网络蓝军:一块CPU,就是一架轰炸机[N];广东科技报;2011年
5 刘清;税务总局严打虚假出口CPU骗取退税行为[N];中国贸易报;2009年
6 何雨欣 李延霞;税务总局:严打虚假出口CPU骗税行为[N];中国企业报;2009年
7 上海硅知识产权交易中心 俞慧月;中国须尽早确定CPU专利对策[N];中国电子报;2009年
8 黑龙江 高林;彩电CPU故障的分析与速修两例[N];电子报;2011年
9 记者 孙勇;税务总局严打虚假出口CPU骗税行为[N];经济日报;2009年
10 本报记者 刘丽丽;浪潮 推新服务器 国产CPU市场化启程[N];计算机世界;2011年
中国博士学位论文全文数据库 前10条
1 葛海通;32位高性能嵌入式CPU及平台研发[D];浙江大学;2009年
2 朱二周;基于CPU/GPU平台的虚拟化技术研究[D];上海交通大学;2012年
3 肖汉;基于CPU+GPU的影像匹配高效能异构并行计算研究[D];武汉大学;2011年
4 王明宇;低功耗双界面CPU智能卡芯片的研究与设计[D];复旦大学;2011年
5 李波;基于异构多核平台的优化编程研究[D];华中科技大学;2011年
6 郑丹丹;嵌入式CPU的纳米尺度SRAM设计研究[D];浙江大学;2009年
7 林一松;面向GPU的低功耗软件优化关键技术研究[D];国防科学技术大学;2012年
8 贾佳;异构并行计算机容错技术研究[D];国防科学技术大学;2011年
9 白洪涛;基于GPU的高性能并行算法研究[D];吉林大学;2010年
10 王桂彬;大规模异构并行系统软件低功耗优化关键技术研究[D];国防科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 成思远;异构(CPU-GPU)计算机系统性能评测与优化技术研究[D];国防科学技术大学;2011年
2 胡杰;CPU-GPU异构平台计算模型的研究与应用[D];大连理工大学;2011年
3 徐连军;双CPU冗余通信控制系统的研究与实现[D];西安电子科技大学;2011年
4 林守林;基于CPU利用率的功率调整策略的研究与实现[D];中国地质大学(北京);2010年
5 冯元华;嵌入式多CPU控制器硬件体系分析与设计[D];暨南大学;2010年
6 徐峰;双界面CPU智能卡并行测试仪设计开发[D];复旦大学;2011年
7 奥飚;运用CPU卡的电力收费系统中密钥管理系统的安全性研究与设计[D];华北电力大学(北京);2011年
8 范晓亮;基于FPGA的双核模型机CPU的设计与实现[D];东北大学;2008年
9 谢萌;针对Multi-core CPU和General Purpose GPU在MATLAB下微分方程常用算法的优化[D];河北科技大学;2012年
10 夏方萍;基于辅助CPU的CFM研究及其实现[D];杭州电子科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026