收藏本站
收藏 | 论文排版

异构多核可重构平台指令并行化关键问题研究

郭琦  
【摘要】:随着半导体技术的进步以及对计算性能的要求越来越高,通用计算处理器的计算性能已经无法满足日益增长的计算需求。计算平台正朝着高性能,专用化的方向发展。然而,传统的特定用途集成电路(Application Specific Integrated Circuit, ASIC)由于运算逻辑的固定性,其通用性受到了很大的限制。与此同时,基于现场可编程门阵列(Field Programmable Gate Arrays, FPGAs)的可重构系统提供了一个理想的平台。一方面,由于其的可编程特性,实现了专有硬件电路的配置,从而具有较高的计算性能;另一方面,由于其可重构的特性,实现了计算资源的重新配置,从而可以适应不同的计算场景。另外,随着单片处理器的性能的发展受到摩尔定律的限制,计算平台还朝着多核化,异构化的方向发展。在多核异构平台上,指令的并行化成为提高执行效率和系统资源利用率的重要手段。因此也出现了多种计算平台上的多种并行化技术,如超长指令字(Very Long Instruction Word, VLIW),超标量(Super Scalar),乱序执行(Out-of-Order Execution)以及通用图形处理器(General Purpose Graphic Processing Unit, GPGPU)编程等。他们分别提供了任务级并行(Task-Level Parallelism, TLP)和指令级并行(Instruction-Level Parallelism, ILP)等不同粒度的并行化方法。本文利用可重构计算平台的特征与优势,将任务级与指令级并行相结合,设计了异构多核可重构计算平台。并基于此平台做了如下研究工作:(1)本文使用软硬件协同设计的方法,设计了一种能够同时支持指令级并行与任务级并行的异构多核可重构计算平台。该平台由IP核、可重构超长指令字处理器、以及中心调度处理器组成。在平台的硬件设计中,使用了基于状态机的IP核设计与封装方法,并可重构超长指令字处理器集成到计算平台上。在平台的软件设计中,设计了中心调度处理器上的编程接口,并且使用通用超长指令字代码生成方法对超长指令字的编译器后端进行了扩展,通过指令的相关性分析,将指令中的操作按照固定的模式重新定位,使得在超长指令字处理器重构时,通过扩展的编译器编译的超长指令字指令可以直接继续执行,而不用重新编译,从而实现发射宽度的动态运行时重构。(2)本文针对异构多核可重构计算平台上的任务级并行问题,使用静态与动态两种方式实现了任务级并行化。该并行化方法采用乱序执行的方式,通过任务相关检测,任务重排序,以及任务映射等步骤,实现了异构多核可重构计算平台上的多种乱序执行方式。通过构造测试用例与实际的案例学习,测试与评估了两种任务级并行化方法的性能,并通过分析比较,给出两者所适用的场景。(3)本文针对可重构超长指令字处理器上的指令级并行问题,设计并实现了一种可重构超长指令字处理器运行时动态重构策略,通过运行时的指令剖析,从而获得程序在不同的执行阶段所需要的发射宽度、执行时间、以及功耗等信息。基于这些信息,采用预测算法,对程序的下一个执行阶段所需的配置信息做出预测,并使用预测结果来控制系统的重构。目的是为了通过系统重构来更好的反映应用程序的需求,从而获得更合理的资源配置方案以及更好的能耗比。另外,本文设计并实现了一种新的数据cache替换策略,在数据cache由于系统的重构而减小时,分别对cache命中与缺失采用不同的替换策略,在cache命中时,若命中在将要被重构掉的那一部分cache,则将命中的数据同时写入保留的那部分cache中;在cache缺失时,则将缺失的数据由内存直接写入保留的那部分cache中。目的是为了减少cache的重构对缺失率的影响,从而实现cache的运行时动态重构。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴正娟;职为梅;杨勇;范明;;并行化的粒子群技术[J];微计算机信息;2009年36期
2 齐书阳;;迎接并行化的明天[J];软件世界;2009年06期
3 曹琳,杨学军,金国华;两种并行化机制的分析[J];计算机研究与发展;1993年09期
4 金国华,陈福接;并行化技术与工具[J];计算机研究与发展;1996年07期
5 蔡立志,童维勤,廖文昭;序列拼装程序的并行化研究与实现[J];计算机工程与应用;2003年14期
6 王伟;潘建伟;;有限差分法的并行化计算实现[J];电脑知识与技术;2008年07期
7 程锦松;;迭代法的并行化[J];安徽大学学报(自然科学版);1997年03期
8 陈再高;王玥;王建国;张殿辉;付梅艳;乔海亮;袁媛;;三维粒子模拟并行化技术研究[J];计算机工程与科学;2009年11期
9 赵凤治;地震作业数据处理并行化的几个问题[J];计算机系统应用;1994年10期
10 高嵩,崔西宁;并行化高级语言的实现[J];西安工业学院学报;1997年02期
11 宋克鑫;陈香兰;陈华平;王篁;;动态二进制翻译的多核并行化中原子指令的翻译研究[J];计算机应用与软件;2013年11期
12 江岭;刘学军;汤国安;宋效东;;地形分析中坡度坡向算法并行化方法研究[J];计算机工程与科学;2013年04期
13 武继刚;一个选择算法及其并行化[J];计算机工程与设计;1996年05期
14 范植华,范路;多岔控制转换的并行化重构[J];电子学报;1999年08期
15 俞一峻,臧斌宇,施武,朱传琪;自动寻找使多重串行循环并行化的幺模变换[J];软件学报;1999年04期
16 竹居智久;邱石;;充分发挥并行化优势开拓出新的应用天地[J];电子设计应用;2006年12期
17 郭克榕,唐新春;基于多层循环并行化的负载平衡优化[J];国防科技大学学报;1997年05期
18 杨博,王鼎兴,郑纬民;构造并行化系统交互环境的若干关键技术[J];软件学报;2001年05期
19 常晓东;胡长军;李永红;;化学驱油藏数模并行化中的关键技术[J];微计算机信息;2007年28期
20 曹磊;程建来;;图像聚类的并行化[J];计算机与现代化;2013年02期
中国重要会议论文全文数据库 前7条
1 兰彤;冯玉才;肖伟器;;空间连接处理的并行化研究[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
2 张雯;骆志刚;赵翔;王金华;靳新;;剪接比对软件sim4的并行化研究与实现[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
3 王本龙;龚凯;刘桦;;自由表面流动问题的并行化SPH方法求解[A];中国力学学会学术大会'2009论文摘要集[C];2009年
4 王峰;杨建俊;张天爵;许淑艳;;不同操作平台上的MCNP并行化计算[A];中国原子能科学研究院年报 2009[C];2010年
5 徐金秀;张天刚;;NCC区域气候模式算法分析及并行化实现[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
6 陈皓;罗月童;刘晓平;;基于MPI的光子映射算法并行化[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 曹琰;王清贤;魏强;尹中旭;;基于相容和搜索结合的并行约束求解方法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
中国博士学位论文全文数据库 前6条
1 郭琦;异构多核可重构平台指令并行化关键问题研究[D];中国科学技术大学;2015年
2 程兴国;仿生算法的动态反馈机制及其并行化实现方法研究[D];华南理工大学;2013年
3 丁晓宁;面向CFD的交互式并行化技术研究[D];西北工业大学;2002年
4 张平;并行化编译器中并行程序自动生成和性能优化技术研究[D];解放军信息工程大学;2006年
5 傅游;稀薄气体Monte Carlo数值仿真并行化技术研究与实现[D];西北工业大学;2002年
6 董春丽;并行化编译中数据和计算的自动划分及优化技术研究[D];解放军信息工程大学;2007年
中国硕士学位论文全文数据库 前10条
1 荣卓波;基于Hadoop的并行化算法实现及GPS数据实例分析[D];西南大学;2015年
2 赖梓昌;基于MPCore多核并行化的宽景视觉研究与实现[D];西南交通大学;2015年
3 杨睿;基于并行计算的基因序列快速比对方法研究[D];浙江大学;2015年
4 王心阳;一种基于MapReduce模型的并行化TSP算法研究[D];电子科技大学;2015年
5 赵正委;基于BSP模型的网络最大流算法的并行化研究与实现[D];电子科技大学;2014年
6 康少华;空间碎片探测软件的并行化及WCRT分析[D];北京理工大学;2015年
7 王向辉;嵌入式浏览器并行化的研究与设计[D];电子科技大学;2014年
8 孙洁;用于超电大散射计算MLFMA并行化及其关键问题的研究[D];电子科技大学;2014年
9 金龑;协同过滤算法及其并行化研究[D];南京大学;2012年
10 李莹;基于共享存储结构的并行化技术及其优化问题的研究[D];中国石油大学(华东);2013年
中国重要报纸全文数据库 前3条
1 ;服务器软件的并行化革命[N];网络世界;2006年
2 谢涛;英特尔:忽视并行化软件后果很危险[N];电脑商报;2008年
3 记者 鲁媛媛;英特尔软件进入并行时代[N];网络世界;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978