收藏本站
《国防科学技术大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

面向高效能计算的编译关键技术:精度、性能与功耗

杨灿群  
【摘要】: 随着计算机技术的不断发展,高端计算已经从追求单一的高性能转向追求综合的高效能,以求解决当前高性能计算领域所面临的实用性能、可编程性与低成本、可移植性、鲁棒性等方面的问题,另外,浮点舍入误差对大规模数值模拟等安全关键领域的精度影响越来越严重,64位的双精度浮点运算已经不能满足需求,必须将超64位的高精度浮点运算的研究也作为这些领域的高效能计算的目标之一。高效能计算的这五个目标相互影响,例如,高精度在提高程序置信度的同时,对性能优化和功耗优化提出了更高的要求。 编译技术为实现高效能计算的各个目标提供基础支持,论文选取了高精度编译、针对高精度的编译优化、低功耗编译优化三个方面展开研究,取得了如下创新性成果: 1、基于硬件对扩展双精度浮点运算的支持,设计并实现了支持扩展双精度浮点运算的FORTRAN编译器——CCRG编译器。该编译器的研制弥补了商用编译器不支持FORTRAN语言的扩展双精度浮点运算的不足,有效保证了科学计算中要求的高精度。采用精度敏感的圆周率计算BBP算法验证了CCRG编译器在扩展双精度浮点运算上的正确性。 2、提出了把表驱动算法与多项式并行计算相结合的指数函数内联算法,该算法也可用于其它超越函数的内联。设计并实现了扩展双精度数学库中的乘幂、除法、方根、指数函数的内联,在有效降低函数调用开销的同时,为指令调度等其它编译优化提供了优化空间。测试表明,数学库函数内联使扩展双精度浮点运算的性能提高了17.8%。 3、结合编译前端提供的数组访问信息,提出了分裂递归链的仿射数组下标依赖关系分析算法,同时,还改进了非仿射数组下标的依赖关系分析算法,增强了针对线性化数组访问的依赖关系分析能力,使CCRG编译器能够有效地进行循环变换,改善数据访问的局部性。 4、从提高指令级并行的角度出发,设计并实现了别名分析、自动函数内联、数据预取、存取地址后增指令优化等多种编译优化算法,有效缓解了高精度计算中的“存储墙”问题。测试表明,这些编译优化算法使CCRG编译器的扩展双精度浮点运算性能提升了42.0%,对比GCC编译器,性能提升66.7%,达到了Intel商用编译器双精度浮点运算(不支持扩展双精度)性能的70.7%,是Intel商用编译器四倍精度浮点运算性能的15.8倍。 5、针对扩展双精度浮点运算的MPI实现中的功耗问题,提出了基于MPI_Barrier的低功耗优化技术以及面向能量优化的MPI_Reduce与MPI_Bcast算法。测试表明,采用扩展双精度的NPB3.2-MPI程序在C级规模下,利用MPI_Barrier操作进行电压调节最大可获得19.2%的能量节约,平均能量节约也达到5.2%。采用面向能量优化的MPI_Reduce和MPI_Bcast算法,MG3D程序分别可获得17.7%和14.2%的能量节约。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP314

【共引文献】
中国期刊全文数据库 前4条
1 张立彪,刘磊;基于建构主义教学观的编译原理教学改革探索[J];吉林大学学报(信息科学版);2005年S2期
2 化春键,赵升吨,申光宪;数值模拟塑性成形过程的并行计算现状[J];锻压技术;2005年01期
3 云晓春,方滨兴,胡铭曾;Sigma系统中数据依赖关系分析的完善与增强[J];计算机研究与发展;1998年03期
4 阳雪林,于勐,陈道蓄,谢立;自动并行编译新技术[J];软件学报;2000年09期
中国重要会议论文全文数据库 前1条
1 张立彪;刘磊;;基于建构主义教学观的编译原理教学改革探索[A];2005全国计算机程序设计类课程教学研讨会论文集[C];2005年
中国博士学位论文全文数据库 前5条
1 林海波;基于EPIC体系结构的软件流水技术研究[D];清华大学;2003年
2 连瑞琦;具有可适应性的程序分析技术[D];中国科学院研究生院(计算技术研究所);2000年
3 芦运照;谓词相关编译技术和深层代码优化[D];中国科学院研究生院(计算技术研究所);2004年
4 刘旸;基于区域的编译技术和栈寄存器优化[D];中国科学院研究生院(计算技术研究所);2003年
5 齐宁;静态二进制翻译中基于软件规范的函数识别及恢复技术研究[D];解放军信息工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 林隽民;基于IA-64体系结构的软件流水优化的研究[D];清华大学;2003年
2 邢文峰;RISC/DSP系统仿真器的研究[D];浙江大学;2004年
3 杨川龙;基于GCC的嵌入式系统编译器的研究与开发[D];哈尔滨工程大学;2006年
4 黄振远;一种星载计算机软件检错技术的研究与实现[D];哈尔滨工业大学;2006年
5 李广强;基于转换的程序分析技术的研究与应用[D];广东工业大学;2007年
6 陈桂茸;基于SUIF2的C程序循环特征分析技术研究与实现[D];国防科学技术大学;2006年
7 殷顺昌;OpenMP并行程序性能分析[D];国防科学技术大学;2006年
8 田世峰;网格环境下面向地震资料处理程序的自动并行化技术研究[D];中国石油大学;2007年
9 崔平非;IA-64二进制翻译中软件流水消除技术的研究与实现[D];解放军信息工程大学;2007年
10 井靖;嵌入式软件集成开发环境的设计与实现[D];解放军信息工程大学;2007年
【同被引文献】
中国期刊全文数据库 前4条
1 金龙飞,刘磊;编译器前端构造工具及JLUCC的实现[J];吉林大学学报(信息科学版);2005年04期
2 丁文魁,汪剑平,向华,李晓明,许卓群;p-HPF并行编译系统核外计算的实现及优化策略[J];计算机学报;1999年10期
3 郑丰宙,陈文光,杨博,郑纬民;基于Range Test的交互式数据相关性分析技术[J];清华大学学报(自然科学版);2000年01期
4 王国栋,侯朝焕;GCC在高性能微处理器DSP和CPU上的移植[J];计算机工程与设计;2005年04期
中国硕士学位论文全文数据库 前1条
1 董峰;LLVM编译系统结构分析与后端移植[D];上海交通大学;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 周毓麟;科学计算用数字电子计算机的若干问题[J];数学进展;1989年04期
【相似文献】
中国期刊全文数据库 前10条
1 ;微软高效能计算平台助力公共服务体系[J];软件世界;2008年06期
2 王之元;胡庆丰;陈娟;;能耗并行加速比:高性能计算系统综合性能的有效度量[J];计算机工程与科学;2009年11期
3 曾宇;王洁;孙凝晖;;曙光5000A高效能计算节点的设计与实现[J];计算机工程;2009年06期
4 曾宇;;高效能计算机技术及标准现状[J];信息技术与标准化;2008年07期
5 陈小军;张璟;李军怀;;虚拟计算系统体系结构的自适应重构设计[J];计算机工程;2011年10期
6 陈左宁;我国高端计算之路与“神威”的探索[J];中国工程科学;2004年09期
7 历军;;扩大技术优势,完善产品结构,服务社会进步——曙光展望09年发展战略[J];网络安全技术与应用;2009年04期
8 ;中国国家网格软件3.0版总体设计通过评审[J];中国教育网络;2007年07期
9 ;山东省开建千万亿次超级计算平台[J];信息技术与信息化;2010年05期
10 ;科技信息[J];黑龙江科技信息;2011年14期
中国重要会议论文全文数据库 前4条
1 周洪伟;陈璞;尹家聪;;自动多重子结构方法及应用[A];2007全国结构动力学学术研讨会论文集[C];2007年
2 宫玉才;周洪伟;陈璞;袁明武;;三种常用固有振动特征值解法的比较[A];2005全国结构动力学学术研讨会学术论文集[C];2005年
3 曾韵;蒋烈辉;董卫宇;;可重构互连网络的发展与现状[A];计算机研究新进展(2010)——河南省计算机学会2010年学术年会论文集[C];2010年
4 徐峻;;从基因组学到化学基元组学[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
中国重要报纸全文数据库 前6条
1 本报记者 佘惠敏 实习生 廖晨;速度更快 功能更强[N];经济日报;2010年
2 范力;曙光为企业采购“量体裁衣”[N];科技日报;2009年
3 记者 刘传书;深圳将建超级计算中心[N];科技日报;2009年
4 黄瑾;我国第三代基因测序仪有望三年内问世[N];中国信息报;2009年
5 记者 戴丽昕;“鲶鱼”行动瞄上绿色超级计算机[N];上海科技报;2010年
6 记者 齐芳;“十一五”期间高性能计算获重要进展[N];光明日报;2010年
中国博士学位论文全文数据库 前3条
1 杨灿群;面向高效能计算的编译关键技术:精度、性能与功耗[D];国防科学技术大学;2007年
2 卢宇彤;面向高效能计算的大规模资源管理技术研究与实现[D];国防科学技术大学;2009年
3 吴丹;高效能计算型存储器体系结构关键技术研究与实现[D];华中科技大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026