收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

FPGA矩阵计算并行算法与结构

邬贵明  
【摘要】:可重构计算是一种基于定制硬件实现的计算形式,现场可编程门阵列(FPGA)便是典型的可重构计算平台。近年来,FPGA芯片集成了越来越多的硬件资源,提供了强大的计算能力,可重构计算领域已渐渐步入可重构超级计算的时代。矩阵计算是科学和工程应用的核心问题,FPGA可重构计算系统在加速矩阵计算方面具有巨大的潜力。然而,FPGA实现矩阵计算还面临着硬件编程、并行算法设计、硬件结构优化等挑战,已有的矩阵计算硬件结构占用了大量FPGA资源、存储需求太高、带宽需求过大,可扩展性也很差。 为应对这些问题和挑战,本文对矩阵计算的FPGA实现技术进行了深入的研究。本文的主要工作和创新点如下: (1)提出了面向基本矩阵运算的FPGA设计方法和高性能、高存储效率分块矩阵乘并行结构。以矩阵向量乘和矩阵乘为例,研究了矩阵计算FPGA实现技术中的时空映射和模型构建方法,实验评测验证了这两种基本矩阵运算并行结构的自动生成框架。利用包括循环分块在内的一系列变换和优化,推导出数据传输优化、存储优化的分块矩阵乘并行算法,得到了一种能够处理任意数据规模矩阵的高性能、高存储效率的矩阵乘并行结构。实验结果表明该并行结构优于相关工作,且存储需求从O(b2)降到了O(b),b为数据块大小。 (2)提出了FPGA列选主元LU分解细粒度流水线并行算法和实现该算法的线性阵列。提出的并行算法能够充分开发LU分解中的流水线并行和数据重用,可以扩展到下三角方程组求解和多右端项的线性方程组求解问题。本文提出了FPGA全硬件实现稠密线性方程组求解的并行结构,结构的核心是实现该并行算法的线性阵列,线性阵列可以同时实现列选主元LU分解和下三角方程组求解。本文还给出了该并行结构的性能模型,从而可以更好地分析和预测其性能。实验结果表明该并行结构优于相关工作和通用处理器的软件实现。 (3)提出了FPGA分块稠密矩阵分解的并行算法和并行结构。以不选主元LU分解为例,提出了一种分而治之的稠密矩阵分解分块策略和FPGA实现方法。该策略对串行LU分解应用包括循环分块、时空映射在内的一系列变换,推导出能够处理任意规模矩阵的分块LU分解并行算法。主要思想是把LU分解算法分解成细粒度计算任务,细粒度任务能够直接映射到FPGA实现的线性阵列,这些任务按照正确的顺序在线性阵列上执行。提出了实现该算法的高性能、高存储效率分块LU分解并行结构。与需要两组线性阵列的结构相比,该结构仅需要一组线性阵列,且存储需求从O(b2)降到了O(b),b为数据块大小。本文还把该分块策略和实现方法扩展到了多FPGA系统,并应用到Cholesky分解。实验结果表明,提出的并行结构计算效率高于通用处理器。 (4)提出了两种稀疏矩阵LU分解并行算法和实现这些算法的并行结构。稀疏矩阵LU分解的数值计算是直接法求解稀疏线性方程组过程中最耗时的一部分,本文提出了两种稀疏矩阵LU分解并行算法:Right-Looking (RL) LU分解并行算法和Left-Looking (LL) LU分解并行算法。前者能够通过开发分解因子的数据重用来减少数据传输,后者能够通过动态相关性检测来开发更多的并行性;两种算法对应的并行结构都能够动态生成分解因子的数据结构。实验结果表明,LL LU分解的并行结构的性能优于RL LU分解的并行结构和通用处理器的软件实现。 (5)提出了新颖的稀疏矩阵向量乘(SpMV)并行结构和共轭梯度法(CG)并行结构。迭代法的计算量往往都集中在处理SpMV,本文对SpMV并行结构进行了深入的研究,并应用到了CG的FPGA实现。提出了一种适合于FPGA设计的稀疏矩阵分块方法和存储格式,基于该存储格式的SpMV并行结构可以有效处理任意大型稀疏矩阵。与相关工作相比,本文提出的两种高效的SpMV并行结构无需改变任何设计参数便可以处理任意矩阵,其中一种结构可以有效减少零的填充。实验结果表明,提出的SpMV并行结构的性能优于相关工作和通用处理器的软件实现;提出的CG并行结构的性能也优于通用处理器的软件实现。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张大庆;周耀荣;;一个用迭代法求解线性方程组的并行算法的实现[J];航空计算技术;1990年01期
2 李晓梅;我国并行算法研究的环境及进展[J];自然杂志;1992年02期
3 王川龙,郭耀鹏;H-分裂与并行算法[J];工程数学学报;1995年03期
4 陈国良;孙广中;徐云;吕敏;;并行算法研究方法学[J];计算机学报;2008年09期
5 陈国良;昔日王榭堂前燕,飞入寻常百姓家浅谈并行算法[J];新电脑;2002年12期
6 方同祝;并行算法在系统仿真中的应用[J];微机发展;1999年04期
7 寿标,李晓峰;更实际的并行算法的设计[J];计算机研究与发展;1996年06期
8 韩晓言,韩祯祥;预处理并轭梯度法在电力系统暂态稳定分析并行算法中的应用研究[J];电力系统及其自动化学报;1996年02期
9 李庆华,陆枫;使用《并行算法的设计与分析》一书作教材的体会[J];教育与现代化;1996年03期
10 张朝阳,王海期,孙炳楠,唐锦春;多跨输电线平面振动特性的并行算法[J];华中理工大学学报;1997年04期
11 朱方生;线性二次型最优控制的并行算法和软件[J];武汉大学学报(自然科学版);1995年03期
12 陈国良;并行算法的可扩放性分析[J];小型微型计算机系统;1995年02期
13 陈国良;《并行算法的设计与分析》简介及其教学法[J];教育与现代化;1995年01期
14 李晓梅 ,胡庆丰;并行算法的发展与展望[J];计算机工程与科学;1991年03期
15 郑士明;;关于多项式求根的一个并行算法的收敛性[J];科技通报;1985年04期
16 谢铁柱;吴功广;;多项式几种并行算法的比较与优化[J];计算机工程与科学;1981年01期
17 王德人,陈小君;一类大规模极小问题的分解并行算法[J];工程数学学报;1984年01期
18 宋晓秋;求解一般带状线性方程组的解耦分解并行算法[J];计算机工程与设计;1995年05期
19 杜云飞;唐玉华;杨学军;;容错并行算法的性能分析[J];计算机科学;2009年09期
20 周庆;胡月;廖晓峰;;一个基于混沌映射的图像加密并行算法[J];计算机工程与应用;2007年22期
中国重要会议论文全文数据库 前20条
1 姚向东;;并行算法到并行结构的映射[A];中国工程物理研究院科技年报(2001)[C];2001年
2 叶继红;王佳;;基于GPU的杆系离散元并行算法在大型工程结构中的应用——第29届全国结构工程学术会议特邀报告[A];第29届全国结构工程学术会议论文集(第I册)[C];2020年
3 焦龙;郭亚红;纪守领;李金宝;;基于多核计算机的分子动力学并行算法的实现[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
4 王轶;席裕庚;;自适应极点配置器设计中的并行算法[A];1994中国控制与决策学术年会论文集[C];1994年
5 高华;苗世光;;城市小区尺度模式并行算法研究[A];中国气象学会2006年年会“中尺度天气动力学、数值模拟和预测”分会场论文集[C];2006年
6 张衡;张武;;三维抛物型初边值问题的块三对角可扩展并行算法[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
7 樊洪明;李先庭;赵彬;任鸿泽;;有限元分布式并行算法研究[A];全国暖通空调制冷2002年学术年会论文集[C];2002年
8 王雷章;张爱武;刘晓萌;;三维建模中平面分割并行算法的设计与实现[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
9 陈平;乔秀全;刘臻;田小萍;;数据挖掘网格中决策树并行算法设计及性能分析[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年
10 林伟军;王秀明;张海澜;;弹性波在非均匀各向异性介质中的传播模拟及其并行算法[A];2004年全国物理声学会议论文集[C];2004年
11 邓力;张文勇;刘杰;许海燕;王瑞宏;李树;;非定常粒子输运蒙特卡罗并行算法研究[A];中国工程物理研究院科技年报(2003)[C];2003年
12 焦海澎;钱立敏;;利用进程环模拟矩阵的并行算法[A];天津市土木工程学会第七届年会优秀论文集[C];2005年
13 张衡;张武;;二维Poisson方程边值问题的块三对角可扩展并行算法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
14 聂智军;王宝园;;基于分区策略的RANS方程并行算法可扩展性分析[A];计算流体力学研究进展——第十二届全国计算流体力学会议论文集[C];2004年
15 葛新科;胡保生;;Lyapunov及Riccati矩阵方程的并行算法[A];1992年控制理论及其应用年会论文集(上)[C];1992年
16 董刚;吴锦涛;刘云峰;;基于建表技术的化学加速并行算法在气相爆轰数值模拟中的应用[A];中国力学大会论文集(CCTAM 2019)[C];2019年
17 王志斌;万玉发;罗兵;沃伟峰;;一种等值线填充并行算法[A];第28届中国气象学会年会——S1第四届气象综合探测技术研讨会[C];2011年
18 刘兴平;莫则尧;张宝琳;;高效并行算法的设计与实现[A];中国工程物理研究院科技年报(1998)[C];1998年
19 张兆功;李建中;;度量空间中相似性搜索的并行算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
20 陈连荣;彭朝晖;;高斯射线声场模型在MPI环境下的并行算法设计[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
中国博士学位论文全文数据库 前20条
1 邬贵明;FPGA矩阵计算并行算法与结构[D];国防科学技术大学;2011年
2 张加乐;面向求解三维复杂流动问题的GPU并行算法及其应用研究[D];南京航空航天大学;2018年
3 周毅;多核CPU/众核GPU加速的并行优化算法研究[D];武汉大学;2016年
4 杜云飞;容错并行算法的研究与分析[D];国防科学技术大学;2008年
5 雷国庆;基于FPGA的图计算并行算法和体系结构研究[D];国防科学技术大学;2015年
6 李雪宝;太阳望远镜海量数据并行处理技术研究[D];中国科学院研究生院(云南天文台);2015年
7 廖臣;三维电磁粒子模拟并行算法及其应用研究[D];电子科技大学;2010年
8 李鸿健;并行算法在激光化学反应模拟中的应用研究[D];电子科技大学;2012年
9 吴超;信息检索中top-k问题的并行算法及优化研究[D];中国科学技术大学;2011年
10 杜刘革;基于多GPU的FDTD并行算法及其在电磁仿真中的应用[D];山东大学;2011年
11 何霞辉;基于非稳态不可压缩流的可扩张并行算法研究[D];湖南大学;2013年
12 李芳;电力系统小干扰稳定分布式并行算法研究[D];中国电力科学研究院;2006年
13 雷霆;快速多极边界元并行算法的研究与工程应用[D];清华大学;2006年
14 姚琼杰;深度学习并行分布式训练机制研究[D];华中科技大学;2020年
15 骆志刚;典型结构大型线性方程组的分布式并行算法研究[D];中国人民解放军国防科学技术大学;2000年
16 张青洁;色散方程的一类高精度并行算法[D];山东大学;2009年
17 江岭;基于DEM的流域地形分析并行算法关键技术研究[D];南京师范大学;2014年
18 许秋燕;二维泊松方程和扩散方程的一类显式并行算法[D];山东大学;2010年
19 张建松;发展方程的重叠型区域分解并行算法[D];山东大学;2008年
20 白洪涛;基于GPU的高性能并行算法研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前20条
1 肖伟;基于Spark计算环境的改进Bayes文本分类并行算法的研究与实现[D];湖南大学;2019年
2 姜庆郁;基于GPU并行算法的扩展多面体DEM-SPH流-固耦合数值模拟[D];大连理工大学;2019年
3 王永振;基于N-S方程的气体静压润滑流场GPU并行算法研究[D];西安工业大学;2019年
4 邓大博;基于Spark计算框架下的带容量约束的车辆路径问题并行算法研究[D];厦门大学;2017年
5 王晟;基于CUDA平台的有限元单元级别并行算法研究[D];沈阳工业大学;2019年
6 刘晓东;三维结构热仿真并行算法研究及软件设计[D];上海交通大学;2017年
7 元润一;基于深度学习的检测与分割并行算法研究[D];吉林大学;2019年
8 段素霞;二维中子输运问题的特征线并行算法研究[D];国防科学技术大学;2017年
9 任沂斌;高性能集群下LiDAR数据生成DEM并行算法研究[D];南京大学;2015年
10 洪文杰;基于申威处理器的PETSc异构并行算法设计和研究[D];湖南大学;2018年
11 赵涛;一种三维非定常线弹性问题的自适应并行算法[D];湘潭大学;2018年
12 唐光平;基于三对角线性方程组的混合并行算法研究[D];湖南大学;2015年
13 聂双;综合孔径微波辐射计图像反演并行算法研究[D];华中科技大学;2017年
14 陈长吉;适用于深度学习的数据预处理并行算法实现及性能优化[D];上海海洋大学;2018年
15 许丹丹;CPU-GPU协同异构环境下卡尔曼滤波的并行算法研究[D];湖南大学;2017年
16 任山;基于查找表的FFT CUDA并行算法研究[D];湖南大学;2017年
17 彭波春;Krylov子空间方法并行算法的全局通信策略[D];福建师范大学;2017年
18 汪少锴;基于GPU的H.264并行算法的研究与实现[D];电子科技大学;2018年
19 李川;几类偏微分方程数值解问题中并行算法研究[D];哈尔滨工程大学;2014年
20 周兰花;基于异构计算的电磁仿真并行算法研究[D];湖南大学;2016年
中国重要报纸全文数据库 前7条
1 ;并行算法研究进展[N];中国计算机报;2004年
2 本报记者 蔡姝雯 实习生 晏庆合;计算机中国“芯”写好“自主可控”铿锵四字[N];新华日报;2021年
3 新华社记者 奚启新 本报通讯员 李汛 记者 喻国英;精彩人生[N];光明日报;2005年
4 新华社记者 奚启新 本报记者 廖文根;三次选择 无怨无悔[N];人民日报;2005年
5 记者 温婷;中国超算再度登顶全球500强[N];上海证券报;2016年
6 ;名师上讲台:每堂课都是精心编排的演出[N];科技日报;2006年
7 本报记者 赵波 本报特约记者 刘程 本报通讯员 章立丁;一位巾帼学者的无悔征程[N];解放军报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978