收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

CPU-GPU融合架构上共享Cache的动态划分技术

孙传伟  
【摘要】:近年来,为了降低片内通信延迟和获得更高的资源利用率,学术界和工业界提出了将CPU和GPU"结合”在同一块芯片上的融合结构。这种CPU和GPU的融合架构大都采用多级缓存层次的结构,并共享末级高速缓存。由于上级高速缓存的局部性过滤作用,致使末级高速缓存的数据局部性较差。传统的LRU缓存替换策略难以有效利用末级高速缓存空间,严重影响程序的性能提升。因此,对末级高速缓存进行更高效地管理和优化,减少末级高速缓存的缺失率对于提高系统的整体性能有非常重要的意义。另外,CPU和GPU具有不同的体系结构,它们在末级高速缓存容量的敏感性上存在差异。GPU上有大量的执行线程,GPU应用程序的访存需求大,因此在LRU替换策略下,GPU程序占用大量的缓存空间,但是程序的性能并没有随着缓存容量的增加而明显提高:在这种情况下,CPU应用程序很难分配到足够的缓存,影响了系统的整体性能。上述两个问题给CPU和GPU间共享的末级缓存管理带来新的挑战。本文分析了GPU应用程序访存特征,借鉴CMP结构下缓存优化策略,提出对CPU-GPU融合架构共享的末级高速缓存进行基于I-M CP动态划分的方案,从而提高系统整体性能。本文的主要研究工作和成果包括以下两点:1.分别从线程切换代价、并行核心、存储带宽、缓存读取方式等方面分析了CPU和GPU架构的区别。在CPU和GPU上运行相应的基准测试程序,并从访存次数、局部性、带宽需求以及访存缺失率等四个方面分析CPU和GPU的访存特征的区别,提出了GPU应用程序缓存敏感性评价方法,并对GPU应用程序进行分类。2.结合末级高速缓存优化策略以及CPU和GPU应用程序的特征,提出了基于CPU-GPU融合架构的共享末级高速缓存I-M CP动态划分方法,对CPU-GPU融合系统的末级高速缓存进行基于I-M CP算法的动态划分。本文通过详细的实验设计,对CPU和GPU的访存特征和缓存划分进行多个维度的测试。实验结果表明,通过缓存划分可以有效避免CPU和GPU程序间的干扰。经过测试后发现,缓存划分方法使得程序整体性能得到了很大提升,说明本文提出的划分方法是十分有效的。与传统LRU策略相比,最优静态划分和I-MCP动态划分可以使系统整体性能分别提升11.62%和13.63%,而两种划分策略使得GPU程序的性能分别只下降了3.27%和0.87%。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 崔昌栋;鞠大鹏;李兆麟;;采用路选择技术实现的低功耗高速缓存设计[J];清华大学学报(自然科学版);2007年01期
2 陈黎明;邹雪城;雷鑑铭;刘政林;;动态可重构高速缓存结构的研究与设计[J];微电子学;2007年06期
3 黄涛;王晶;管雪涛;钟祺;王克义;;一种降低末级高速缓存污染的软件控制插入策略[J];电子学报;2012年12期
4 孙丕恕,辛卫华;高速缓存386系统的实现[J];小型微型计算机系统;1989年09期
5 徐景村,何培斌;微机高速缓存系统组织与数据更新探讨[J];山东师大学报(自然科学版);1998年01期
6 周全营;计算机存储系统的高速缓存[J];郑州纺织工学院学报;1999年S1期
7 吴英杰,王晓东;理想高速缓存模型及其高效算法研究[J];福州大学学报(自然科学版);2004年04期
8 胡泽林;张云泉;;高速缓存优化的并行连接算法[J];计算机工程与设计;2009年20期
9 刘娟;共享外部超高速缓存的双处理机块的设计和实施[J];航空计算技术;1998年01期
10 ;iCache提速详解[J];每周电脑报;2000年12期
11 ;五君子助力EBDC[J];每周电脑报;2000年41期
12 蔡建兵,王晓东;矩阵乘法的高速缓存复杂性分析[J];福建电脑;2003年12期
13 John Clyman ,伍颖文;双处理幕后的结构[J];个人电脑;1995年09期
14 黄涛;王晶;王克义;;一种降低末级高速缓存污染的分阶段自适应动态插入策略[J];北京大学学报(自然科学版);2014年02期
15 ;“动态高速缓存”有关问题解答[J];电脑;1995年01期
16 吴英杰,王晓东;高速缓存参数无关的高效算法[J];福建电脑;2003年12期
17 Johann Holzmann;;利用现代高速缓存体系结构进行嵌入式控制[J];电子产品世界;2005年24期
18 唐枫;钟珞;;利用WEB缓存解决网络流量问题[J];交通与计算机;2006年01期
19 蒋勇;如何选配高速缓存?[J];电脑爱好者;1996年01期
20 ;回音[J];微电脑世界;1996年05期
中国重要会议论文全文数据库 前1条
1 高欣;刘衡竹;张波涛;;高速缓存优化研究与设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
中国博士学位论文全文数据库 前2条
1 方磊;适用于多/众核系统的智能目录高速缓存[D];浙江大学;2014年
2 隋秀峰;高性能微处理器中自适应高速缓存管理策略研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 孙传伟;CPU-GPU融合架构上共享Cache的动态划分技术[D];中国科学技术大学;2015年
2 冷冰;基于路访问轨迹和路休眠的高速缓存低功耗研究[D];浙江大学;2012年
3 吴英杰;充分利用高速缓存的高效算法研究[D];福州大学;2004年
4 梁静;基于路预测访问的低功耗高速缓存设计研究[D];浙江大学;2012年
5 赵彩;基于混合纠错码的可容错性高速缓存研究[D];浙江大学;2015年
6 陈石坤;多核处理器中CACHE一致性协议研究和实现[D];国防科学技术大学;2005年
7 姜彩萍;互联网高速缓存系统构建和性能分析[D];吉林大学;2004年
8 李瑞东;高速缓存参数无关DNA短序列精确比对算法[D];哈尔滨工业大学;2013年
9 陈燕晖;页面分配器的研究与实现[D];国防科学技术大学;2006年
10 虞增辉;轻量级Web浏览器的协议、技术及其实现[D];浙江大学;2005年
中国重要报纸全文数据库 前10条
1 飞思卡尔半导体公司汽车和标准产品部Johann Holzmann;利用高速缓存体系结构进行汽车引擎嵌入式控制[N];中国电子报;2005年
2 杨阿昭;ECDN 提高网络性能[N];中国计算机报;2002年
3 宋占川;Oracle服务器性能调整攻略[N];计算机世界;2003年
4 高明云;高速缓存技术实现更快内容传输[N];人民邮电;2003年
5 山枫;趋势科技利用高速缓存方案 企业防毒性能长5倍[N];中国计算机报;2002年
6 陈怡均 DigiTimes;IBM研发新DRAM电路[N];电子资讯时报;2007年
7 本报记者 武汉;来跟着我的节拍[N];网络世界;2003年
8 小溪综合编译;新一代视频游戏机上演三国大战[N];计算机世界;2006年
9 ;显卡术语释义[N];电脑报;2002年
10 山东财政学院 杨晓红;为电子商务站点加速[N];计算机世界;2000年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978