收藏本站
《战略支援部队信息工程大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

面向国产处理器的OpenMP程序编译优化技术研究

高雨辰  
【摘要】:随着高性能计算机规模越来越大,结构越来越复杂,高性能计算机系统利用率很低,并行程序无法充分利用高性能计算系统的计算能力的问题越来越突出。并行编程问题一直是高性能计算机发展面临的重大挑战,其有效解决对于充分发挥高性能计算机的作用,提升高性能计算机系统的效率具有至关重要的作用。伴随着并行体系结构和处理器芯片的发展,计算机系统提供的计算资源越来越多,结构越来越复杂,程序员手工编写并行程序的难度也越来越大,因此并行化技术的研究显得越来越重要。本文针对“神威·太湖之光”国产处理器的性能特点,对OpenMP程序的循环调度策略和并行化技术进行了研究,主要工作和贡献有以下几点:(1)对DOALL循环的调度策略进行分析研究。本文从循环的调度策略入手,将DOALL循环的调度策略按照访问存储器的方式分为两类,分别对两类调度策略进行总结阐述,对不同调度算法的调度开销和负载均衡等方面进行深入的分析,对不同调度算法的优缺点进行了详细的对比。(2)对DOACROSS循环的调度策略进行分析研究。按照依赖距离的不同,DOACROSS循环可分为两类,本文分别对两类循环展开研究,并对两类DOACROSS循环的优缺点进行了详细的对比分析。(3)对循环自动并行化技术进行了分析与研究。对循环自动并行化的研究工作进了梳理,首次将循环的并行方式分为SIMD向量并行、DOALL并行、DOACROSS流水并行以及TASK流水并行等四种方式,并进行详细分析。本文通过对标准测试集程序进行测试,验证本文观点的正确性和有效性。本文的研究,对于自动并行化系统的研制以及应用程序的优化存在一定的指导意义。
【学位授予单位】:战略支援部队信息工程大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP38

【参考文献】
中国期刊全文数据库 前8条
1 谢向辉;胡苏太;;中国“863计划”高性能计算的发展[J];科研信息化技术与应用;2015年04期
2 赵捷;赵荣彩;韩林;李宝亮;;面向MPI代码生成的Open64编译器后端[J];计算机学报;2014年07期
3 刘晓娴;赵荣彩;赵捷;徐金龙;;面向规则DOACROSS循环的流水并行代码自动生成[J];软件学报;2014年06期
4 王涛;;“天河二号”超级计算机[J];科学;2013年04期
5 刘晓娴;黄品丰;;面向异构系统的OpenMP程序自动生成[J];信息工程大学学报;2012年04期
6 杜建成,陈道蓄,谢立;JAPS:一个基于JAVA的程序自动并行化系统[J];中国科学E辑:技术科学;1999年03期
7 朱传琪,臧斌宇,陈彤;程序自动并行化系统[J];软件学报;1996年03期
8 金国华,陈福接;KD-PARPRO:一个基于知识的并行化工具——总体设计与功能描述[J];软件学报;1993年06期
中国博士学位论文全文数据库 前1条
1 魏帅;面向SIMD的向量化算法及重组技术研究[D];解放军信息工程大学;2012年
中国硕士学位论文全文数据库 前2条
1 夏睿杰;基于FT-Matrix2的自动向量化关键技术研究与实现[D];国防科学技术大学;2015年
2 戴晓如;并行编译中的代码生成和通讯优化[D];中国科学院研究生院(计算技术研究所);2000年
【共引文献】
中国期刊全文数据库 前10条
1 云硕;关庆锋;;基于异构集群计算的地统计面插值并行算法[J];地球信息科学学报;2015年12期
2 李雁冰;赵荣彩;丁锐;赵博;;面向异构多核处理器的分块交叉数据传输[J];信息工程大学学报;2015年01期
3 孙煦雪;李莹;袁新宇;徐印成;;交互式并行化系统ZIPS[J];计算机工程;2010年20期
4 蔡跃进;;分布式环境下的自动并行化调度算法[J];泉州师范学院学报;2010年04期
5 祁鑫;梁鸿;田世峰;;基于网格的叠前深度偏移程序自动并行化模型[J];实验室研究与探索;2009年06期
6 沈勤华;;可扩展的自动并行化编译系统[J];计算机工程;2009年08期
7 牛海发;牛明博;;一种基于虚拟仪器的舵机测试系统研制[J];实验技术与管理;2007年02期
8 史涛,陆林生,饶若楠,蔡涛;PPCDS集成开发环境的设计与实现[J];计算机工程与应用;2005年05期
9 陆林生,董超群,王玲秋,史涛;并行程序概念设计方法的研究[J];计算机学报;2003年09期
10 丁晓宁,傅游,康继昌;面向CFD的交互式并行化技术研究[J];西北工业大学学报;2003年01期
中国博士学位论文全文数据库 前1条
1 阳柳;面向动态双模多层次并行体系结构的编译优化技术研究[D];国防科学技术大学;2014年
中国硕士学位论文全文数据库 前3条
1 高雨辰;面向国产处理器的OpenMP程序编译优化技术研究[D];战略支援部队信息工程大学;2018年
2 陈达智;MPI并行代码生成与通信优化技术研究[D];解放军信息工程大学;2012年
3 刘晓娴;全局数组数据流分析技术的研究与实现[D];解放军信息工程大学;2009年
【二级参考文献】
中国期刊全文数据库 前2条
1 赵捷;赵荣彩;丁锐;黄品丰;;基于嵌套循环分类的并行识别技术[J];软件学报;2012年10期
2 杜建成 ,陈道蓄 ,谢立;JAPS: an automatic parallelizing system based on JAVA[J];Science in China(Series E:Technological Sciences);1999年04期
中国博士学位论文全文数据库 前3条
1 李玉祥;面向非多媒体程序的SIMD向量化方法及优化技术研究[D];中国科学技术大学;2008年
2 付雄;利用程序分析和优化提高Cache性能[D];中国科学技术大学;2007年
3 朱嘉华;SIMD编译优化方法研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 周羽丰;Matrix2可扩展向量化编译方法的设计与实现[D];国防科学技术大学;2014年
2 宋贵环;YHFT-Matrix2编译器SIMD优化技术研究与实现[D];国防科学技术大学;2014年
3 索维毅;面向DSP的自动向量化及优化技术研究[D];解放军信息工程大学;2013年
4 庄巍;YHFT-Matrix DSP低功耗向量运算单元设计与归约网络研究[D];国防科学技术大学;2012年
5 王碧文;FT-Matrix DSP浮点算术部件的设计与实现[D];国防科学技术大学;2012年
6 淡孝强;YHFT-Matrix编译器SIMD指令自动向量化技术的研究与实现[D];国防科学技术大学;2012年
7 黄远广;多宽度SIMD结构DSP向量存储器的设计与实现[D];国防科学技术大学;2012年
8 辛乃军;面向高性能DSP Matrix向量化编译器的设计与实现[D];国防科学技术大学;2011年
9 朱嘉风;面向SIMD的编译指导与条件分支的编译优化技术[D];解放军信息工程大学;2011年
10 黄磊;循环变换技术在自动向量化中的应用研究[D];解放军信息工程大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 谷克宏;黄岷;何江银;;基于多核集群的MPI+OpenMP混合并行编程模型研究[J];甘肃科技;2018年19期
2 胡建平;王剑钢;;基于OpenMP的共轭梯度法并行加速[J];电脑编程技巧与维护;2016年06期
3 赵辉;王振夺;;基于OpenMP的任务调度与负载均衡技术的分析与研究[J];福建电脑;2013年04期
4 赵辉;钱文光;杨丽娟;;OpenMP中负载平衡优化的分析与研究[J];福建电脑;2011年06期
5 孙洪迪;高柱;;基于OpenMP技术的多核处理器程序的开发实现[J];北京工业职业技术学院学报;2010年01期
6 ;OpenMP compiler for distributed memory architectures[J];Science China(Information Sciences);2010年05期
7 周洪斌;温一军;;基于OpenMP的多核程序设计技术[J];沙洲职业工学院学报;2010年02期
8 刘热;;OpenMP多核技术研究及其在遗传算法中的应用[J];沈阳大学学报;2010年05期
9 李建江;舒继武;陈永健;王鼎兴;郑纬民;;一种基于动态并行区的OpenMP程序开发模式[J];计算机研究与发展;2006年03期
10 黄江林;陈立亮;;基于OpenMP的凝固数值模拟并行计算[J];铸造;2006年07期
中国重要会议论文全文数据库 前10条
1 易成建;彭向和;贾延杰;李海涛;;基于OpenMP的磁流变液并行数值模拟[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
2 张永彬;唐春安;贾敬辉;梁正召;;OpenMP在岩石动力并行计算中的应用[A];第3届全国工程安全与防护学术会议论文集[C];2012年
3 宋克庆;黄春;;基于OpenMP快速傅里叶变换并行实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
4 王庆;季振洲;刘涛;;面向嵌入式多核存储层次的OpenMP优化研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
5 侯振隆;;基于多GPU和OpenMP-CUDA混合编程的相关成像反演并行算法研究[A];2017中国地球科学联合学术年会论文集(三十八)——专题71:内磁层动力学、专题72:计算地球物理方法和技术、专题73:地热:“学”以致“用”、专题74:电磁卫星观测与应用[C];2017年
6 顾文杰;李杰臣;龚俭;;基于OpenMP的网络管理系统性能改进[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
7 孟念青;Jason Wang;;Hybrid LS-DYNA新特色介绍[A];第七届中国CAE工程分析技术年会暨2011全国计算机辅助工程(CAE)技术与应用高级研讨会论文集[C];2011年
8 杨凯;;基于OPENMP的高性能GNSS法方程解算方法研究[A];重庆工程师论文集[C];2014年
9 肖调杰;王赟;刘云;汪超;宋滔;成联正;寻超;;大地电磁二维正演的MPI及OpenMP的并行计算对比[A];中国地质学会2015学术年会论文摘要汇编(下册)[C];2015年
10 何涛;李爱波;黄渊;;基于OpenMP多线程技术的SAR地面处理软件的并行设计[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
中国重要报纸全文数据库 前3条
1 清华大学 郑纬民 陈文光;开发环境—搭建应用的基础[N];计算机世界;2003年
2 本报记者  谢文砚;要重视并行环境开发[N];网络世界;2006年
3 宋家雨;集群撑不起全部天空[N];网络世界;2006年
中国博士学位论文全文数据库 前10条
1 马红途;OpenMP程序分析及优化技术研究[D];解放军信息工程大学;2009年
2 黄春;面向分布共享存储体系结构的高效能OpenMP关键技术研究[D];国防科学技术大学;2007年
3 陈永健;OpenMP编译与优化技术研究[D];清华大学;2004年
4 吴少刚;机群系统OpenMP研究[D];中国科学院研究生院(计算技术研究所);2004年
5 章隆兵;提高机群OpenMP系统性能的关键技术研究[D];中国科学院研究生院(计算技术研究所);2004年
6 富弘毅;OpenMP并行程序容错技术研究[D];国防科学技术大学;2010年
7 郭惠芳;面向多核的并行模式及编译优化技术研究[D];解放军信息工程大学;2011年
8 刘晓娴;面向共享存储结构的并行编译优化技术研究[D];解放军信息工程大学;2013年
9 王旭;众核系统的片上网络和存储结构研究[D];吉林大学;2010年
10 刘智翔;改进的格子Boltzmann方法研究及大规模并行计算[D];上海大学;2014年
中国硕士学位论文全文数据库 前10条
1 刘洋;OpenMP程序中基于活跃变量分析的检查点优化[D];湖南大学;2014年
2 高雨辰;面向国产处理器的OpenMP程序编译优化技术研究[D];战略支援部队信息工程大学;2018年
3 杨林杰;基于OpenMP的LDPC并行译码算法研究与实现[D];西南交通大学;2018年
4 徐杰;AVS2视频编码RDOQ的快速算法及基于OpenMP的帧级并行解码的实现[D];西南交通大学;2018年
5 魏朝磊;基于OpenMP的颗粒流体力学方法的并行算法研究[D];北京林业大学;2016年
6 游佐勇;OpenMP并行编程模型与性能优化方法的研究及应用[D];成都理工大学;2011年
7 张东岳;基于OpenMP的电力系统无功优化并行计算[D];郑州大学;2016年
8 Fillipus M. S. Abisai(麦森);基于OpenMP的三维热传导方程并行预处理共轭梯度法研究[D];中国地质大学(北京);2010年
9 王昭飞;OpenMP程序中的未指定行为和死锁的静态检测[D];国防科学技术大学;2005年
10 殷顺昌;OpenMP并行程序性能分析[D];国防科学技术大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026