收藏本站
《国防科学技术大学》 2016年
收藏 | 手机打开
二维码
手机客户端打开本文

基于高性能协处理器的粒子输运模拟加速关键技术研究

王庆林  
【摘要】:粒子输运方程,用来描述给定介质中粒子的质量、电量、动量以及能量的守恒关系,其数值求解在许多物理和工程领域有着广泛的应用,如天体物理学的天体探测、医学领域中的放射性治疗、核反应堆以及核武器设计等。随着应用需求的推动,粒子输运方程的高精度模拟需求不断增加,物理建模不断精细,导致计算规模成千上万倍的增加。此外,在某些特定应用领域,粒子输运数值模拟还面临高实时性需求的挑战。近年来,运用具有高性能功耗比的协处理器进行计算加速已经成为高性能并行计算发展的重要趋势。然而,协处理器的种类多样化以及硬件结构的复杂化,使得协处理器加速粒子输运模拟面临着并行算法设计与优化、编程模型多样性、合理选择协处理器难度大等挑战。为应对这些挑战,本文基于MIC和FPGA两种高性能协处理器,开展了粒子输运确定性方法和蒙特卡罗方法的并行加速算法或结构研究,取得的研究成果主要包括以下几个方面:1.提出了基于MIC的三维结构化网格多级并行扫描算法,以实现结构化网格下粒子输运有限差分离散纵标方程的并行求解。该算法开发了波阵面扫描过程中的多级并行性,将波阵面中I-line网格柱的扫描直接映射到MIC的并行硬件线程上,并通过隔离关键物理量的计算实现了I-line网格柱上迭代求解有限差分离散纵标方程的向量化。数值实验结果表明,对于不进行负通量修正的情况,MIC与CPU上的并行实现相比可以获得了2.03倍的加速效果;对于进行负通量修正的情况,MIC能够获得1.50倍的性能加速。2.提出了两种基于MIC的二维非结构化网格多级并行扫描算法,以实现非结构化网格下粒子输运间断有限元离散纵标方程的并行求解。在并行求解之前,设计了搜索排序算法来确定扫描过程中的波阵面及其排序。第一种算法采用并行硬件线程来开发波阵面中全部网格在所有能群上的并行性,并采用向量单元来开发单个网格单元在单能群上离散方程求解中的数据级并行性。第二种算法采用并行线程和向量单元来协同开发单个波阵面中所有网格单元在所有能群上计算的并行性,并进行了存储性能优化。数值实验结果显示,与CPU上的串行实现相比,两种算法能够分别获得39.92倍和71.54倍的性能加速。3.提出了基于MIC的快速蒙特卡罗多级并行模拟算法,以实现光子和电子耦合的快速蒙特卡罗辐射输运DPM的快速求解。在该算法中,设计了多级并行访问数据结构来满足线程和向量两级并行的访存需求,并在线程级并行化基础上,进行了数据局部性优化,通过构建多级并行随机数发生器,实现了电子输运大部分过程的向量化模拟。数值实验表明,基于MIC的DPM实现与CPU上的DPM实现在精度上保持一致。与CPU上的DPM串行实现相比,基于MIC的多级并行算法能够获得16.22到18.82倍的性能加速。4.提出了基于FPGA的快速蒙特卡罗并行加速模拟结构,以实现光子的快速蒙特卡罗辐射输运的快速求解。该结构基于单精度浮点实现,通过流水线并行、位级并行以及特殊的结构设计,使得该结构具有低功耗和高性能等特点。数值实验表明,基于FPGA的并行加速结构所产生的剂量分布与软件计算结果吻合。与3.40GHz CPU和2.30Ghz CPU上的串行实现相比,该加速结构能够分别获得22.15倍和33.18倍的性能提升。综上所述,本文对基于MIC和FPGA的粒子输运并行数值求解算法进行了深入研究,使其能够最大化地开发MIC和FPGA的计算潜力,为推动相应数值模拟的实际应用、基于高性能协处理器构建面向粒子输运的专用大规模并行计算系统以及基于协处理器的粒子输运大规模并行求解奠定基础。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:O572.2;TP332

【相似文献】
中国期刊全文数据库 前10条
1 张健浪;;协处理器平台打造战略核心[J];个人电脑;2006年10期
2 张雨浓;马伟木;李克讷;易称福;;简述协处理器发展历程及前景展望[J];中国科技信息;2008年13期
3 赵成彦;;80387协处理器的选购与安装[J];电脑爱好者;1995年07期
4 朱樟明,周端,杨银堂,徐阳扬;嵌入式协处理器初等函数的快速统一实现[J];电子与信息学报;2004年02期
5 史焱,吴行军;高速双有限域加密协处理器设计[J];微电子学与计算机;2005年05期
6 金钊;;32位嵌入式CPU中系统控制协处理器的设计与实现[J];电子设计应用;2006年10期
7 吴康;;应用安全协处理器构建一个金融终端中的安全嵌入式系统[J];中国公共安全(综合版);2006年06期
8 孙季丰;袁春林;盛艳青;刘斌;;一种通用安全协处理器[J];计算机工程;2008年22期
9 魏强;金然;寇晓蕤;王清贤;;基于安全协处理器保护软件可信运行框架[J];计算机工程与设计;2008年15期
10 孙俊杰;;闪存大佬推协处理器将闪存推向更广阔市场[J];中国电子商情(基础电子);2012年08期
中国重要会议论文全文数据库 前4条
1 欧庆于;张昌宏;;应用安全协处理器构建安全嵌入式系统[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(上册)[C];2006年
2 孟宪元;;FPGA实现DSP系统的结构模型[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
3 庞博;张长明;;基于CORDIC算法的数字协处理器设计与测试[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
4 李建赢;王虹宇;洪朝群;姜巍;;PIC/MC模型在Intel Xeon Phi上的初步实现与优化[A];第十六届全国等离子体科学技术会议暨第一届全国等离子体医学研讨会会议摘要集[C];2013年
中国重要报纸全文数据库 前10条
1 记者 周源;英特尔首批至强融合协处理器问世[N];网络世界;2012年
2 沈文;AMD+ATI能否双赢?[N];计算机世界;2006年
3 记者  孙永杰;“核”战何时休 客户需求最重要[N];中国电子报;2006年
4 《网络世界》记者 周源;MIC:以后请叫我“Phi”[N];网络世界;2012年
5 马文方;AMD收购ATi值不值?[N];中国计算机报;2006年
6 Altera公司高级产品行销经理 Paul Ekas;FPGA协处理器优化汽车信息系统设计[N];中国电子报;2004年
7 ;TD-SCDMA手机采用协处理器[N];网络世界;2001年
8 ;新品速递[N];计算机世界;2001年
9 ;采用协处理器的TD-SCDMA手机设计[N];人民邮电;2001年
10 岳婷;AP面临基带和协处理器竞争[N];中国电子报;2007年
中国博士学位论文全文数据库 前6条
1 郑乔石;暗硅时代CoDA架构可扩展性及能效问题研究[D];西北工业大学;2015年
2 王庆林;基于高性能协处理器的粒子输运模拟加速关键技术研究[D];国防科学技术大学;2016年
3 宋宇鲲;动态可重构协处理器研究[D];合肥工业大学;2006年
4 杜学亮;定制指令与协处理器加速机制的研究[D];中国科学技术大学;2009年
5 郑裕峰;高速包分类协处理器及网络平台研究[D];中国科学技术大学;2007年
6 王荣华;动态二进制翻译优化研究[D];浙江大学;2013年
中国硕士学位论文全文数据库 前10条
1 宋阳;TD-LTE系统PUSCH信道关键技术及其实现[D];电子科技大学;2015年
2 黄亚晴;基于FPGA矢量协处理器架构的信号处理机研究[D];中国舰船研究院;2015年
3 杨静;基于有限差分的心电模型模拟在CPU与多MIC协处理器平台的并行与优化[D];国防科学技术大学;2013年
4 陈呈;面向MIC平台的OpenACC实现与优化关键技术研究[D];国防科学技术大学;2013年
5 刘春;HINOC2.0 MAC协处理器的仿真与板级验证[D];西安电子科技大学;2014年
6 梁志力;异构多核系统中协处理器优化[D];合肥工业大学;2015年
7 董辛楠;基于通信优化的多MIC协处理器平台上的并行编程研究[D];国防科学技术大学;2014年
8 高峥;HINOC2.0 SoC系统HIMAC协处理器的仿真及FPGA验证[D];西安电子科技大学;2015年
9 林焕;应用于近场通信安全单元的AES协处理器设计[D];华中科技大学;2015年
10 王捷;一种高性能向量处理器的实现[D];天津大学;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026