收藏本站
《国防科学技术大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

面向多核处理器的并行编译及优化关键技术研究

王淼  
【摘要】: 传统的单核处理器通过提高运行频率来提高计算性能。然而,单纯增加晶体管数目不仅耗用大量晶体管资源,而且随着时钟频率不断攀升,微处理器的功耗也迅速增加。提高芯片性能和减少能耗成为矛盾,单核处理器的性能提升已成为瓶颈。为解决这一问题,多核结构的设计思想应运而生。通过在单个芯片上集成多个高效内核,就可以在保持工作频率的条件下实现性能的提升,以获得更高的能效。多核处理器按照集成的处理器核的种类分为同构多核处理器和异构多核处理器。异构多核处理器将不同类型的内核集成在一起,在效率和性能方面往往要优于同构多核处理器。目前,异构多核处理器在加速实际应用方面获得了很高的性能,相关技术已被逐渐运用到新型高性能计算机中。异构多核处理器的特征为高性能并行计算提供了巨大潜力,但是,异构多核处理器在并行编程、存储层次管理等方面都很复杂,另外,在自动并行工具以及软件通用性方面仍有很多难题亟待解决,如何充分利用异构多核对编程模型和编译技术都提出了很大挑战。 本文重点围绕异构多核编译系统设计及优化等问题进行研究,本文所提出的编译方法不仅适应于特定异构多核处理器,也适应于其他异构多核处理器系统。本文的主要工作和技术创新概述如下: (1)提出了面向异构多核处理器的代码自动生成框架。以异构多核处理器Cell为实例,基于分布式存储模型为Cell处理器设计并实现了一个源到源编译器。该编译器利用数据对齐、数据分布等技术将程序中的数据自动划分到不同的处理器核中,并根据不同数据分布机制为应用程序插入通讯原语,生成不同版本的可在Cell上运行的SPMD(Single Program Multiple Data)并行程序。首次在Cell上实现了一个高效的多核通讯库,该库包括send/recv、shift和transpose等通讯原语,通讯协议基于Cell的mailbox机制实现。最后,通过实验验证了编译器的有效性和性能,同时与IBM XL C/C++ OpenMP编译器进行了比较,证明了与共享存储编程模型相比,分布式存储编程模型更适于Cell等异构多核处理器。 (2)提出了面向异构多核处理器的数据自动管理框架。针对协处理器核局部存储器容量无法满足大数据规模应用的问题,本文提出并实现了一个数据自动管理系统,该系统通过分级数据分布、通讯生成和循环分块等方法对程序中的数据和计算进行分解,使得分解后的数据能够满足局部存储容量的约束。为了减少访存,提高局部存储中数据的重用性,本文还提出了一个通讯优化方法,该方法为程序构建重用图,并根据重用图划分来删除冗余通讯。最后基于异构多核处理器Cell对数据自动管理框架进行了验证和评测,实验表明,该框架能够很好的管理Cell局部存储中的数据,为应用生成高效的代码。 (3)提出了面向异构多核处理器的模型驱动的多任务多级并行方法。为了协调异构多核处理器中的计算资源和存储资源,本文首先对异构多核资源管理问题进行抽象,提出并实现了一个资源管理模型,该模型对应一个三维的优化空间,包括变量选择、任务分组和PE(Processing Element)分配。然后,本文提出并实现了一个基于基因算法的智能搜索方法对模型的优化空间进行搜索,来为程序选择性能较优的并行策略。最后基于异构多核处理器Cell对模型进行验证。实验表明,本文设计的资源管理模型能够在极短的时间内为应用确定较好的并行策略,极大的减轻了程序员的编程负担。 (4)提出了面向多媒体应用的SIMD(Single Instruction Multiple Data)代码自动生成方法。根据多媒体应用的特点,本文实现了一系列循环变换方法来发掘循环中更多的SIMD并行。针对如何判断循环中哪些部分适于利用SIMD并行,本文提出并实现了基于代价子图的指令选择方法,该方法对循环中可利用SIMD并行的部分进行评估。本文通过利用循环展开、寄存器重命名等方法为应用生成SIMD指令。最后通过实验对指令选择、代码生成方法以及程序性能进行了验证和评估。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP332

手机知网App
【引证文献】
中国期刊全文数据库 前3条
1 黄品丰;赵荣彩;韩林;刘晓娴;;OpenMP数据分布子句自动生成算法[J];计算机工程;2013年03期
2 曹倩;刘立红;颉斌;陈洪菊;;基于超图的非规则应用局部性优化[J];北京科技大学学报;2012年12期
3 王淼;漆锋滨;;异构多核代码自动生成框架[J];计算机科学与探索;2013年06期
中国博士学位论文全文数据库 前2条
1 姚宏;基于群论的数据依赖模型及循环并行化研究[D];华南理工大学;2017年
2 郭羽成;MPI高性能云计算平台关键技术研究[D];武汉理工大学;2013年
中国硕士学位论文全文数据库 前5条
1 易浩;基于内部威胁控制的安全网络系统的研究与实现[D];湖南大学;2016年
2 李雁冰;面向异构多核处理器并行化编译中的数据优化[D];解放军信息工程大学;2014年
3 李慧敏;基于SimpleScalar的多媒体应用程序特征分析研究[D];湖南大学;2013年
4 黄品丰;面向异构处理器的代价模型及存储优化技术研究[D];解放军信息工程大学;2013年
5 史汉嶂;VPN设备若干安全性及性能的测试工具设计与实现[D];西安电子科技大学;2012年
【参考文献】
中国期刊全文数据库 前1条
1 祁建清;基因算法在密码学中的应用分析[J];信息工程大学学报;2003年01期
中国博士学位论文全文数据库 前1条
1 汪黎;面向软件管理片上存储器的编译优化技术研究[D];国防科学技术大学;2009年
【共引文献】
中国期刊全文数据库 前3条
1 陶嘉磊;汪受传;姜茗宸;戴启刚;;消风宣窍汤对小鼠变应性鼻炎模型效应机制研究[J];南京中医药大学学报;2017年02期
2 吴进平;;加味瓜蒌薤白半夏汤治疗冠心病心绞痛的临床疗效分析[J];世界最新医学信息文摘;2015年A3期
3 赵英强;;毒邪致真心痛的临证心得[J];天津中医药大学学报;2015年06期
【同被引文献】
中国硕士学位论文全文数据库 前10条
1 林志添;一种不完全依赖栈的ROP攻击技术的研究[D];南京大学;2015年
2 毕凤金;基于角色的访问控制系统在ERP中的设计与实现[D];电子科技大学;2015年
3 周爱军;基于协议分析IPV6人侵检测系统的设计与实现[D];电子科技大学;2015年
4 张德生;基于移动Agent的网络对抗训练系统的设计与实现[D];电子科技大学;2015年
5 匡蕾;基于蜜罐技术的内部威胁检测模型的设计与实现[D];重庆大学;2014年
6 张建松;基于行为特征分析的恶意代码检测系统研究与实现[D];电子科技大学;2014年
7 黄品丰;面向异构处理器的代价模型及存储优化技术研究[D];解放军信息工程大学;2013年
8 余勇;GPU程序的二进制翻译关键技术研究[D];解放军信息工程大学;2012年
9 包向华;循环插值差分脉冲编码调制算法研究[D];浙江大学;2009年
10 孙诚;内部威胁检测技术研究[D];国防科学技术大学;2008年
【二级引证文献】
中国硕士学位论文全文数据库 前6条
1 彭关礼;基于FPGA的AES算法硬件设计实现[D];西华师范大学;2018年
2 袁亚鹏;面向异构多核系统的层次化存储结构设计与优化[D];合肥工业大学;2018年
3 刘诗华;三维有限差分瞬变电磁正演的OpenAcc并行研究[D];中国地质大学(北京);2017年
4 王鹏翔;面向异构结构的OpenMP代价模型和基于有利性的循环交换[D];解放军信息工程大学;2017年
5 李雁冰;面向异构多核处理器并行化编译中的数据优化[D];解放军信息工程大学;2014年
6 傅立国;面向分布存储结构的通信生成及代价评估技术研究[D];解放军信息工程大学;2014年
【二级参考文献】
中国期刊全文数据库 前10条
1 孟薇;李敬孝;;血府逐瘀汤辅助治疗不稳定型心绞痛的临床研究[J];中医药学报;2014年05期
2 王婷;罗尧岳;谢海波;石协桐;郭震林;郑源;吴涛;;血府逐瘀汤对心肌缺血大鼠模型血清NO及缺血区心肌组织VEGF、DLL4蛋白表达的影响[J];中医药导报;2014年07期
3 靳宏光;齐锋;姜丽红;;基于痰瘀伏邪理论评价穴位敷贴法治疗冠心病稳定型心绞痛的临床疗效[J];中国中医急症;2014年02期
4 刘传合;陈育智;;儿童哮喘流行病学及防治现状分析[J];中国实用儿科杂志;2013年11期
5 杨晓波;;“治未病”理论在小儿支气管哮喘中的临床应用[J];中医儿科杂志;2013年04期
6 杨宏志;;难治性哮喘中医辨因防治初探[J];中华中医药杂志;2013年03期
7 王椿野;赵振武;李新龙;李麒豫;董洪坦;郭蓉娟;;基于现代文献的动脉粥样硬化中医病机研究[J];环球中医药;2013年02期
8 赵凤林;卢先彬;杨徳钱;黄路梅;;丹参酮ⅡA磺酸钠注射液治疗不稳定型心绞痛临床观察[J];中国中医急症;2012年11期
9 常立萍;邢笑佳;邓悦;;伏邪理论指导治疗血管重建术后冠状动脉粥样硬化性心脏病临床疗效研究[J];环球中医药;2012年09期
10 齐锡友;董致郅;谢春荣;;从病因病机谈颈动脉粥样硬化与痰浊的关系[J];北京中医药;2012年06期
【相似文献】
中国期刊全文数据库 前10条
1 于俊清;余华飞;魏海涛;秦明康;;多核环境下编译器辅助消息驱动的动态调度[J];计算机学报;2014年07期
2 吴佳骏;吴承勇;张兆庆;;网络处理器的编译器聚集[J];计算机工程;2007年03期
3 常瑞生;;异构多核处理器任务调度算法研究[J];信息通信;2016年05期
4 徐远超;谭旭;范灵俊;孙卫真;张志敏;;性能不对称多核处理器负载均衡调度研究[J];计算机工程与科学;2013年11期
5 李雁冰;赵荣彩;丁锐;赵博;;面向异构多核处理器的分块交叉数据传输[J];信息工程大学学报;2015年01期
6 蒋建春;汪同庆;;异构多核处理器的任务调度算法[J];计算机工程与应用;2009年33期
7 邓让钰;陈海燕;窦强;徐炜遐;谢伦国;戴泽福;李永进;夏军;罗莉;张民选;;一种异构多核处理器的并行流存储结构[J];电子学报;2009年02期
8 金玉苹;焦平;佟阳;;异构多核处理器分支预测器研究与设计[J];微电子学与计算机;2011年11期
9 蒋建春;汪同庆;;一种异构多核处理器嵌入式实时操作系统构架设计[J];计算机科学;2011年06期
10 汪少敏;赵猛;朱振博;王艳琦;;基于多核处理器并发计算软件构架设计与实现[J];计算机科学;2008年07期
中国重要会议论文全文数据库 前10条
1 何军;王飙;;通用多核处理器发展现状和趋势研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
2 刘磊;周庆;井蔚;刘冰;;基于多核处理器的网络安全协议并行处理研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
3 王力生;张欣;;基于多核处理器的动态负载平衡并行遗传算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 孟宪元;;异构多核处理器实现智能处理系统[A];第十届全国信号和智能信息处理与应用学术会议专刊[C];2016年
5 万志涛;章恒;张若渊;;基于多核处理器的深度包检测的实现和性能评估[A];中国通信学会信息通信网络技术委员会2009年年会论文集(上册)[C];2009年
6 方娟;张红波;;多核处理器预取策略的研究[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
7 王丽;贾天杨;刘剑;;《编译原理》课程的国际化研究[A];辽宁省高等教育学会2013年学术年会暨第四届中青年学者论坛论文摘要集[C];2013年
8 曾勇军;王清贤;奚琪;;基于抽象区间域的数组边界检查技术[A];计算机研究新进展(2010)——河南省计算机学会2010年学术年会论文集[C];2010年
9 项凌翔;黄江伟;施青松;陈天洲;;基于DVS的动态节能编译器的设计与实现[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
10 赵一明;徐瑞娇;罗荣海;;面向国产高性能多核DSP的并行编译器设计[A];第十五届中国航天电子技术研究院学术交流会优秀论文集[C];2018年
中国重要报纸全文数据库 前10条
1 卢旭成;Intel推出编译器专业版 简化开发多核处理器[N];中国计算机报;2007年
2 江南计算技术研究所 何正未;软件滞后制约多核应用[N];计算机世界;2006年
3 ;SGI推出针对IA-64的编译器Pro64[N];计算机世界;2000年
4 ;什么是编译器[N];中国计算机报;2002年
5 张兆庆 冯晓兵;我国编译器研发的历史与现状[N];科技日报;2002年
6 记者 吴苡婷;国内首款商用反编译器上海造[N];上海科技报;2010年
7 记者 曹继军 颜维琦;我国多核处理器研究实现新突破[N];光明日报;2012年
8 ;勤哲Excel服务器2013版强化多核处理器支持[N];电脑报;2013年
9 简墨;新“硬”用风暴[N];电脑报;2009年
10 蒋楠;美国 青少年变身“多核处理器”[N];中国计算机报;2006年
中国博士学位论文全文数据库 前10条
1 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年
2 苑风凯;多核处理器末级私有高速缓存优化技术研究[D];哈尔滨工业大学;2017年
3 袁通;基于多核处理器的内存数据库查询执行优化研究[D];西安电子科技大学;2016年
4 易娟;面向多核处理器系统的可靠性与能耗优化调度研究[D];重庆大学;2016年
5 王树朋;基于仿真的多核处理器功能验证技术研究[D];浙江大学;2017年
6 高翔;多核处理器的访存模拟与优化技术研究[D];中国科学技术大学;2007年
7 岳虹;嵌入式异构多核处理器设计与实现关键技术研究[D];国防科学技术大学;2006年
8 张必英;考虑负载差异性的多核处理器稳态温度及性能分析方法研究[D];哈尔滨工业大学;2017年
9 吕海;多核处理器芯片计算平台中并行程序性能优化的研究[D];北京工业大学;2012年
10 聂鹏程;多核处理器上的操作系统调度[D];西安电子科技大学;2013年
中国硕士学位论文全文数据库 前10条
1 李雁冰;面向异构多核处理器并行化编译中的数据优化[D];解放军信息工程大学;2014年
2 石祥龙;基于异构多核处理器的静态任务调度算法研究[D];南京邮电大学;2015年
3 潘非;嵌入式SRAM编译器的容量扩展方法的研究[D];安徽大学;2014年
4 申瑞芬;高可信安全编译器的设计与实现[D];国防科学技术大学;2007年
5 项炜;微型编译器的实现及优化讨论[D];电子科技大学;2007年
6 任小西;嵌入式系统编译器的快速生成方法研究[D];湖南大学;2004年
7 张朝;基于异构多核处理器的准直图像嵌入式处理平台研究[D];中国工程物理研究院;2016年
8 向建华;基于基准划分的编译器优化自动测试框架[D];北京交通大学;2008年
9 曾楠;可重定目标编译器辅助移植系统设计实现[D];厦门大学;2006年
10 邓际锋;支持静态元编程的可扩展式开放编译器的研究与实现[D];华东师范大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026