收藏本站
《吉林大学》 2010年 博士论文
收藏 | 手机打开
二维码
手机客户端打开本文

基于GPU的高性能并行算法研究

白洪涛  
【摘要】: 计算机图形处理器(Graphics Processing Unit,GPU)的高速发展,不但促进了图像处理、虚拟现实、计算机仿真等应用领域的快速发展,同时也为人们利用GPU进行图形处理以外的通用计算提供了良好的运行平台。基于GPU的图形处理及其通用计算成为图形学及高性能计算领域的热点研究课题。基于GPU的高性能并行算法研究是该课题的重要内容之一。本文以探索GPU大规模并行通用计算的运用模式为目标,从传统问题入手,选择典型算法进行研究,主要研究了数值类算法中的非计算密集型算法、数据密集类算法和元启发式优化算法这三类算法在GPU上的并行化。数值类算法中的非计算密集型算法存在内存墙问题,而在基于GPU的并行化过程中,该瓶颈尤为突出。本文以稀疏矩阵向量乘算法为代表,研究基于GPU并行化方法以及性能优化策略。数据密集类算法由于其特有的数据可分割性,因而比较适于GPU并行计算。本文以频繁模式挖掘算法和最近邻搜索算法为代表,研究了此类算法的GPU并行化方法以及性能优化策略;针对最近邻搜索问题,结合KD-Tree空间划分与ABT方法,提出了适于欧几里德距离的点剪枝策略。元启发式优化算法是求解大规模优化问题的高效方法之一,其解空间搜索过程具有天然的并行性。本文以蚁群算法为代表,研究了蚁群算法及其若干改进算法在GPU上的并行化方法;针对蚂蚁个体智能性不足的问题,提出了带有展望策略的蚁群优化算法;针对蚁群参数敏感问题,研究了多蚁群在GPU上同时进化方法,提出了适于GPU的粗/细粒度结合的多蚁群算法;针对异构多蚁群的信息交流问题,提出了一种新的基于共享信息素矩阵的交流策略。大量的标准测试表明,上述算法可以达到几倍甚至上百倍的加速比;与已有的同类基于GPU的并行算法相比,上述算法具有更高的实际浮点性能和存储器带宽。CPU+GPU的异构多核架构是目前GPU大规模并行通用计算的运用模式,探讨传统算法的GPU并行化方法,使之更适用于异构多核架构下并行计算,能够为基于GPU的高性能计算的普及提供理论和方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张大鹏,陈骏林;图象处理并行算法分析及其实现[J];宇航学报;1989年02期
2 贺瑞容,吴恩华;物理场图形生成的多处理机并行算法的研究和实现[J];计算机学报;1992年01期
3 曾泳泓,蒋增荣;GFT及离散卷积的并行算法及其实现[J];数值计算与计算机应用;1993年01期
4 张可军;陈福接;;求解线性丢番图方程(组)的串、并行算法[J];计算机工程与科学;1993年01期
5 朱和;李晓梅;;计算几何与并行算法[J];计算机工程与科学;1993年03期
6 杨克复;;并行处理技术[J];沈阳理工大学学报;1993年01期
7 任春丽,徐甲同,王俊平;实对称三对角矩阵特征值的一种并行算法及实现[J];西安电子科技大学学报;1999年02期
8 徐娟,汪懋华;用于图象处理的小波变换并行算法[J];小型微型计算机系统;1999年01期
9 董科军,刘让苏,郑采星,胡庆丰,何新芳;液态金属凝固过程分子动力学模拟的并行算法研究[J];计算机工程与科学;2000年03期
10 杨克复,马忠胜;非线性优化的并行算法[J];沈阳工业学院学报;2000年02期
11 易法令,李庆华,杨薇薇;Delaunay三角剖分并行算法研究及实现[J];小型微型计算机系统;2001年04期
12 重剑无锋;;并行算法中指针转移技术解析[J];中文信息;2003年10期
13 陈静瑾,邓雅诺,马文龙,余宁梅;USB2.0中CRC码的并行算法及硬件实现[J];西安理工大学学报;2004年03期
14 陈宏建,陈崚,李开荣,陈莉莉;RAPWBN的矩阵乘法并行算法[J];计算机工程;2004年23期
15 谭国律,陈博政;关于矩阵最优路径算法的探讨[J];计算机应用与软件;2005年01期
16 周益民,孙世新,田玲;一种实用的所有点对之间最短路径并行算法[J];计算机应用;2005年12期
17 李晓梅;吴建平;;Krylov子空间方法及其并行计算[J];计算机科学;2005年01期
18 李云强;;数据挖掘中关联规则算法的研究[J];大众科技;2006年01期
19 隽志才;倪安宁;贾洪飞;李杰;;两种策略下的最短路径并行算法研究与实现[J];系统工程理论方法应用;2006年02期
20 王元元;曾建潮;谭瑛;;基于环形结构带缓存器模型的并行微粒群算法[J];微电子学与计算机;2006年09期
中国重要会议论文全文数据库 前10条
1 王元元;曾建潮;谭瑛;;基于并行计算模型的并行微粒群算法的性能分析[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
2 王轶;席裕庚;;并行的极点配置算法及其新构想[A];1994年中国控制会议论文集[C];1994年
3 杜云飞;王攀峰;富弘毅;周海芳;杨学军;;矩阵LU分解的容错并行算法设计与实现[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
4 曹淑瑛;郭圣权;樊水康;;并行极点配置算法探讨[A];1995年中国控制会议论文集(下)[C];1995年
5 王韶娟;曾国荪;;分形维数的一个并行算法[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
6 陈宁涛;王能超;施保昌;;生物多序列比对的并行算法[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
7 孙明珠;王鹏;邱枫;杨玉良;;自洽场理论的实空间求解方法的并行算法以及在嵌段共聚物相分离中的应用[A];2005年全国高分子学术论文报告会论文摘要集[C];2005年
8 李朝鹏;李肯立;;基于分层聚类的并行数据预处理算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
9 姜弘道;余天堂;;有限元并行分析的进展——第九届全国结构工程学术会议特邀报告[A];第九届全国结构工程学术会议论文集第Ⅰ卷[C];2000年
10 张红虎;吴硕贤;;声学辐射度方法的并行实现[A];第十届全国噪声与振动控制工程学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 白洪涛;基于GPU的高性能并行算法研究[D];吉林大学;2010年
2 孟志刚;蚁群觅食仿真和动画的研究[D];中南大学;2011年
3 孟志刚;蚁群觅食仿真和动画的研究[D];中南大学;2011年
4 吴超;信息检索中top-k问题的并行算法及优化研究[D];中国科学技术大学;2011年
5 韩丛英;若干优化问题的并行算法研究[D];上海交通大学;2008年
6 周杰;合成孔径雷达数据处理应用的细粒度并行算法与结构[D];国防科学技术大学;2010年
7 闻育;复杂多阶段动态决策的蚁群优化方法及其在交通系统控制中的应用[D];浙江大学;2004年
8 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
9 谭国真;时变、随机网络最优路径算法及其应用研究[D];大连理工大学;2002年
10 王建;并行最优化算法与软件设计及数值软件移植[D];中国科学院研究生院(软件研究所);2005年
中国硕士学位论文全文数据库 前10条
1 辛师勃;并行信号处理系统研究[D];南京理工大学;2004年
2 吴青;基于地理信息系统的配电网优化规划的研究[D];广西大学;2004年
3 刘淼;基于平衡分割的并行序列比对[D];西安电子科技大学;2007年
4 潘海琳;高拱坝体形优化决策系统研究[D];河海大学;2006年
5 焦建英;求解微分方程的区域分解两重网格算法[D];西安理工大学;2007年
6 游聪伟;基于GPU平台的KLU并行算法的研究:对角线块的LU分解[D];内蒙古大学;2011年
7 于战华;跨声速欧拉方程并行算法研究及应用[D];南京航空航天大学;2004年
8 平晓慧;最短路径问题的并行算法研究[D];大连理工大学;2006年
9 孙超;快速分形图像压缩并行算法研究与实现[D];曲阜师范大学;2011年
10 彭强;基于并行Boost图库的单源最短路径并行算法的研究[D];华南理工大学;2010年
中国重要报纸全文数据库 前10条
1 记者 李天舒;蚁群间分工方式不同与基因密切相关[N];健康报;2010年
2 许志刚王群力;蚁群的启示[N];中华工商时报;2002年
3 ;并行算法研究进展[N];中国计算机报;2004年
4 ;中小企业做大“蚁群经济”[N];经理日报;2005年
5 子闽;蚁群效应——简洁高效应对环境变化[N];中国劳动保障报;2009年
6 本报记者 海霞;“蚁群经济”衍生“大象效益”[N];中国经济导报;2005年
7 英国《每日邮报》 杨孝文 译;蚁群中发现皇室斗争和欺骗[N];北京科技报;2008年
8 陈捷;“蚁群智能”与组织效力[N];中华工商时报;2002年
9 通讯员  毕迪 记者  王浩;养一头羊平均增收四五十元[N];杭州日报;2006年
10 李讯 特约记者 刘程 本报记者 于莘明;银河有颗闪亮的星[N];科技日报;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978