收藏本站
《西北工业大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

暗硅时代CoDA架构可扩展性及能效问题研究

郑乔石  
【摘要】:硅工艺朝着物理极限的不断迈进,导致了由摩尔定律和登纳德定律组成的集成电路传统缩放模型失效。在芯片功耗墙的限制下,人们发现在后登纳德定律时代,芯片设计中存在使用墙问题以及由此所观察到的暗硅现象。更进一步地,随着工艺的持续进步,暗硅现象会不可避免地急剧恶化,使得芯片设计进入暗硅时代。在暗硅时代,芯片上可以在极限时钟频率下翻转的晶体管的比例急剧下降,这使芯片上出现大量无法有效利用的晶体管。这些不断增加的无法使用的晶体管,导致在设计芯片时功耗和能耗与芯片的面积相比更为重要。这种设计思路的转变导致了利用暗硅来换取高能量效率的新型体系结构不断涌现,大量集成异构专用协处理器就是其中之一。单个专用协处理器与通用处理器相比可以提高10倍以上的能量效率,使得集成少量专用协处理器的系统能量效率大大提高。但常见的系统具有大量不同的应用负载,为了提高这样系统的能量效率,架构师需要集成大量的异构专用协处理器并调度软件到专用协处理器上执行。这使得最终系统架构成为Co DA (Coprocessor-Dominated Architecture)。本文紧紧围绕作者作为GreenDroid和暗硅团队成员在加州大学圣迭戈分校工作期间,所进行的论证CoDA架构设计合理性、可扩展性、能量效率、发现解决未来CoDA架构实现所遇到的潜在问题展开,进行了以下几个方面的创新性工作:(1)研究了CoDA对应用的适用性,并以此说明CoDA适合暗硅时代。本文分析了安卓移动软件栈,发现大部分应用是基于共享原生库和虚拟机的,硬件化这部分软件就可以使得应用的大部分运行在专用协处理器上。之后重点分析了安卓浏览器,并使用硅构造专用协处理器实现了这个浏览器。实验结果表明在22nm工艺下7mm2的硅面积用于构造专用处理器就可以覆盖浏览器90%的运行。使用可接受的硅面积就可以覆盖应用执行,证明了CoDA架构适合暗硅时代。(2)针对快速探索CoDA设计空间的需求,提出了CoDA架构分析模型,并对本文提出的多维度可扩展CoDA架构进行建模。该架构可以由不同数量的瓦片组成,每一个瓦片可以包含不同数量的函数粒度专用协处理器,并且每一个专用协处理器都可以是异构的。分析模型用来评估每一种特定CoDA架构的能量、面积和性能;模型参数既包含了高层次的体系结构参数,也包含低层次的电路实现参数。(3)探索了CoDA架构在不同Cache配置、瓦片大小、粗粒度能耗管理策略以及晶体管实现等参数下的能量效率问题。在最优化的参数条件下,与通用架构相比小规模CoDA设计可以带来5.3倍的能量效率优化和5倍的能量延时积(energy-delay product,EDP)优化;而对于支持上百个应用的大规模CoDA设计,可以带来3.7倍的能量效率优化和3.5倍的EDP优化。这说明为大规模应用而设计的大规模CoDA扩展是有效的。此外,本文发现CoDA设计即使采用了激进的能耗管理策略,漏电功耗所占总功耗的比例仍然随CoDA规模增大而增大。(4)探索了并发执行对CoDA能量效率的影响。积极的影响是这些同时运行的程序或线程可以分摊漏电功耗等固定的开销,这样可以提高系统的能量效率。消极的影响是,当驱动CoDA生成的目标应用集合和实际运行的应用集合不匹配时,会造成大量程序竞争某些专用协处理器,系统的平均能量效率将大大降低。本文提出CoDA架构集成覆盖多个函数功能的融合QsCore来减少竞争冲突。实验表明使用融合QsCore的方式,仅仅增加41%的面积就可以提供2倍数量的专用协处理器,并使得非均匀分布负载的能量效率提高11.1%~22.1%。(5)针对使用当前工艺实现的FPGA模拟下一代工艺实现的CoDA芯片时,单个FPGA芯片资源不足的问题,提出了跨多芯片可扩展的2D-mesh片上网络。该网络由跨芯片的环形网络连接,并为跨芯片的每一个2D-mesh物理通道分别提供跨芯片的流控机制。跨芯片的环形网络提供了ASIC芯片到FPGA以及FPGA之间两种可选连接方案。通过使用该设计方案,本文使用两块Virtex 6 FPGA芯片首次实现了CoDA架构原型系统。
【学位授予单位】:西北工业大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP332

【相似文献】
中国期刊全文数据库 前10条
1 史焱,吴行军;高速双有限域加密协处理器设计[J];微电子学与计算机;2005年05期
2 魏强;金然;寇晓蕤;王清贤;;基于安全协处理器保护软件可信运行框架[J];计算机工程与设计;2008年15期
3 孙俊杰;;闪存大佬推协处理器将闪存推向更广阔市场[J];中国电子商情(基础电子);2012年08期
4 梁政 ,沈绪榜;一种嵌入式协处理器的设计[J];微电子学与计算机;2001年05期
5 宁建荣;关英志;尹华东;;嵌入式系统中的语音协处理器的设计[J];仪表技术与传感器;2006年04期
6 ;人机接口协处理器大力提升语音应用的性能[J];今日电子;2012年08期
7 Rob Wilson ,李腊元 ,史德轩;一种新颖的协处理器接口[J];系统工程与电子技术;1986年08期
8 冉蜀阳;实时控制用协处理器[J];机床电器;1995年01期
9 沈旭昆,赵沁平;类比推理协处理器设计中的加速策略[J];北京航空航天大学学报;1998年04期
10 沈旭昆,王双全,王军玲,李波,赵沁平;类比推理协处理器的实现[J];软件学报;1998年05期
中国重要会议论文全文数据库 前4条
1 欧庆于;张昌宏;;应用安全协处理器构建安全嵌入式系统[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(上册)[C];2006年
2 孟宪元;;FPGA实现DSP系统的结构模型[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
3 庞博;张长明;;基于CORDIC算法的数字协处理器设计与测试[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
4 李建赢;王虹宇;洪朝群;姜巍;;PIC/MC模型在Intel Xeon Phi上的初步实现与优化[A];第十六届全国等离子体科学技术会议暨第一届全国等离子体医学研讨会会议摘要集[C];2013年
中国重要报纸全文数据库 前10条
1 记者 周源;英特尔首批至强融合协处理器问世[N];网络世界;2012年
2 记者  孙永杰;“核”战何时休 客户需求最重要[N];中国电子报;2006年
3 沈文;AMD+ATI能否双赢?[N];计算机世界;2006年
4 《网络世界》记者 周源;MIC:以后请叫我“Phi”[N];网络世界;2012年
5 马文方;AMD收购ATi值不值?[N];中国计算机报;2006年
6 Altera公司高级产品行销经理 Paul Ekas;FPGA协处理器优化汽车信息系统设计[N];中国电子报;2004年
7 ;TD-SCDMA手机采用协处理器[N];网络世界;2001年
8 ;新品速递[N];计算机世界;2001年
9 ;采用协处理器的TD-SCDMA手机设计[N];人民邮电;2001年
10 岳婷;AP面临基带和协处理器竞争[N];中国电子报;2007年
中国博士学位论文全文数据库 前5条
1 宋宇鲲;动态可重构协处理器研究[D];合肥工业大学;2006年
2 杜学亮;定制指令与协处理器加速机制的研究[D];中国科学技术大学;2009年
3 郑裕峰;高速包分类协处理器及网络平台研究[D];中国科学技术大学;2007年
4 郑乔石;暗硅时代CoDA架构可扩展性及能效问题研究[D];西北工业大学;2015年
5 王荣华;动态二进制翻译优化研究[D];浙江大学;2013年
中国硕士学位论文全文数据库 前10条
1 庞博;高性能专用数字协处理器的设计与测试[D];电子科技大学;2009年
2 淮侃;手机多媒体协处理器芯片的应用与实现[D];西安电子科技大学;2007年
3 金钊;64位高性能嵌入式CPU中系统协处理器的设计与实现[D];同济大学;2007年
4 范凯;基于动态可重构技术的阵列型协处理器架构设计与实现[D];上海交通大学;2010年
5 李鹏;8087数值协处理器的分析与设计[D];西安电子科技大学;2001年
6 赖明澈;数据并行协处理器体系结构的研究与实现[D];国防科学技术大学;2005年
7 姚于斌;面向图像处理的可重构协处理器结构设计研究[D];上海交通大学;2008年
8 吴舜晓;全数字导航接收机协处理器技术研究[D];国防科学技术大学;2009年
9 段凌霄;嵌入式安全协处理器设计[D];浙江大学;2014年
10 董冕;高性能混合计算协处理器计算内核的研究与实现[D];华中科技大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026