收藏本站
《中国科学技术大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

片上多处理器体系结构中Cache一致性模型研究

李功明  
【摘要】:现代的片上多处理器大都采用共享存储结构,每个处理器核都拥有自己的私有缓存,这就需要高速缓存一致性模型来管理共享数据。早期的缓存一致性模型多用于板级多处理器系统中,对于片上多处理器结构而言,实现缓存一致性模型的技术参数及约束条件都发生了变化,从而带来了许多新的研究问题。由其是通过扩展高速缓存一致性模型实现硬件事务存储和推测多线程机制,为大幅度降低共享存储并行编程的复杂性带来了新的机遇。因此,围绕着高速缓存一致性模型的功能扩展、性能优化以及提高可扩展性等方面的工作仍然是工业界和学术界共同关注的热点研究问题。 本文主要从高速缓存一致性模型的功能扩展和性能优化两个方面开展研究工作,通过发掘高速缓存一致性模型在功能及性能两方面的潜在优势,来达到对多核处理器芯片上晶体管资源的充分利用,并在保证片上多处理器模型扩展性的基础上,提升整个系统的性能,以适应未来多核及众核体系结构对高速缓存一致性模型的需要。本文研究工作的主要内容和成果如下。 本文工作的第一部分是研究高速缓存一致性协议功能扩展模型。通过扩展高速缓存一致性协议的功能,实现对硬件事务存储机制及推测多线程机制混合模型的高效支持。硬件事务存储机制及推测多线程机制都可以采用高速缓存一致性模型的功能扩展来实现,且二者对硬件的需求类似,因此可以提供对二者的统一硬件支持。但是针对单个芯片中有限的硬件资源及功耗的限制,及应用程序对自身性能日益增长的需求,如何能实现一个高效的功能扩展模型,仍是一个重要的问题。针对此问题,本文在事务存储及推测多线程两种机制的统一高效硬件支持方面展开了深入的研究,其主要研究成果包括:(1)提出了一个新的基于高速缓存一致性模型的功能扩展模型TT-Dir,此扩展模型可以同时支持事务存储及推测多线程两种机制;(2)为TT-Dir模型引入了快速回退机制,在保证原始事务及推测线程提交速度的前提下,实现了对粒度较小的事务及推测线程的快速回退;(3)为TT-Dir模型引入了冲突容忍机制,实现了对并发推测线程之间写后读及写后写型二义性冲突的容忍,减少了并发推测线程间的冲突数量;并针对事务存储模型引入了动态定序机制,使上述冲突容忍机制也能适用于事务存储模型中。对模型的评测结果表明,TT-Dir模型可以在满足较小硬件需求及功耗的基础上,有效提升上述两种机制自身的性能。 本文工作的第二部分是研究高速缓存一致性协议优化模型,包括性能优化和可扩展性优化两个方面。现代应用程序对性能及吞吐率的需求越来越高,因此需要片上高速缓存一致性模型不断提升其性能,以满足上层应用的需求;且随着片上处理器核数越来越多,片上高速缓存一致性模型需要提供良好的扩展性,以满足未来多核及众核体系结构发展的需要;此外,单个芯片上有限的硬件资源及功耗约束又为高速缓存一致性模型的扩展性引入了新的难点。为了对高速缓存一致性模型的性能及扩展性影响因素进行详细的分析,本文首先将高速缓存一致性模型的实现分为网络层及行为层两个方面,并从这两个方面分别进行了深入研究,主要研究成果包括:(1)在网络层方面,本文首先对片上网络中影响高速缓存一致性模型性能的因素进行了分析,根据分析结果提出了基于阶段优先级的一致性模型PPB, PPB模型引入了“阶段性”消息的概念,使不同阶段的消息具有不同的优先级;随后本文还给出了此PPB模型的具体实现机制,这其中包括一致性消息优先级的设置及相应片上网络中的仲裁机制;(2)在行为层方面,本文针对目录一致性模型的性能及硬件需求两个方面进行了优化,提出了一个基于本地目录机制的高速缓存一致性模型Loc-Dir。首先,此Loc-Dir模型采用了本地目录模型来降低一致性模型实现的硬件需求,即保证了一致性模型的扩展性;其次Loc-Dir模型引入了预测机制来降低目录一致性模型中的间接数据传输延迟,在预测器的实现中,本文提出了基于通信模式的预测器来扩展可预测地址的范围;最后,本文还提出了针对应用程序中通信模式的优化策略,并提出了对本地私有缓存的替换策略的修改方案,以使其适应上述Loc-Dir的预测机制。 本文的研究工作获得了如下一些重要的认识:(1)片上高速缓存一致性模型可以高效地应用于并行编程模型,以简化并行编程模型对共享数据的管理;(2)片上网络与高速缓存一致性模型之间相互依赖且相互制约,一致性模型产生的一致性消息直接影响了片上网络的负载量,而一致性消息在片上网络中的传输也影响了一致性模型自身的性能,所以,建立起一致性模型与片上网络的接口,以实现对二者的协同管理,是提升整个系统性能的关键;(3)对于目录一致性模型来讲,多级目录机制是降低目录开销的重要策略;而针对应用程序中的数据共享模式或者通信模式进行优化,也是目录一致性模型获得性能提升的一个重要方法。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP333

免费申请
【相似文献】
中国期刊全文数据库 前10条
1 李健航,潘孝梅;Pentium体系结构简介[J];微型机与应用;1994年10期
2 戴梅萼,史嘉权;计算机系统存储体设计技术的探讨[J];微型机与应用;1995年03期
3 周军;病毒能藏在CMOS和CACHE中吗?[J];电脑爱好者;1998年12期
4 尚毅,向旭光;怎样使奔腾586奔起来[J];实验技术与管理;1996年02期
5 周翚,侯滨;Proxy Server中Cache的管理和使用[J];现代计算机;2000年01期
6 陈文革,程向前;高速地址CACHE——散列表的应用[J];微型机与应用;2002年03期
7 钟永锋,张江陵;RAID阵列中高速Cache管理的优化[J];计算机与数字工程;1998年05期
8 王湘娜,蒋本珊,徐渐;基于RAID5的磁盘阵列Cache的研究与实现[J];计算机工程;2003年03期
9 吴惠民;施平安;文学义;;高速专用网络处理器体系结构技术的研究[J];中国水运(学术版);2007年05期
10 王宇江,王晶洁;PC机系统的优化[J];黄金学报;1996年03期
中国重要会议论文全文数据库 前10条
1 彭林;张小强;刘德峰;谢伦国;田祖伟;;一种挖掘多核处理器存储级并行的算法[A];第15届全国信息存储技术学术会议论文集[C];2008年
2 何军;王飙;;通用多核处理器发展现状和趋势研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
3 石文强;倪晓强;金作霖;张民选;;Cache动态插入策略模型研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
4 邓亚丹;吴京;熊伟;景宁;;基于共享cache多核处理器的数据库内存排序优化[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 郑涵;吴英;丁晓东;乐嘉锦;;基于Web的个性化智能Cache库[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 张承义;郭维;周宏伟;;Cache漏流功耗的自适应优化:动态容量调整[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
7 李凡;李建中;何震瀛;;XML数据Cache策略研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 刘杰;马彦;叶维;高剑刚;;多核处理器存储体系分析[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
9 尹飞;吴磊;;基于功能覆盖率验证多核处理器中的Cache一致性协议[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
10 李鑫;窦勇;邓林;张劲;;多核平台下事务处理类应用性能分析及评价[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
中国重要报纸全文数据库 前10条
1 张云泉;并行计算:迎接多核时代的挑战[N];计算机世界;2006年
2 清华大学计算机系 教授 汪东升;多核架构让硬件变“软”[N];计算机世界;2007年
3 旭;多核多线程 H3C高端路由器新特点[N];网络世界;2007年
4 本报记者 李敬;多核催熟UTM[N];计算机世界;2008年
5 ;信威McWiLL/SCDMA基站采用TI多核DSP[N];人民邮电;2008年
6 ;我们访问到了吗?[N];中国高新技术产业导报;2000年
7 本报记者 瑜文;“星火燎原”多核大学扩张在即[N];中国电脑教育报;2007年
8 阿晨;2007年服务器市场跨进多核时代[N];中华读书报;2007年
9 本报实习记者 张海志;多核时代敲门电脑营销大战[N];中国知识产权报;2006年
10 本报记者 陈斌;多核的软件推力[N];计算机世界;2008年
中国博士学位论文全文数据库 前10条
1 李功明;片上多处理器体系结构中Cache一致性模型研究[D];中国科学技术大学;2013年
2 郭御风;面向多核微处理器芯片的高效能I/O体系结构及其实现技术[D];国防科学技术大学;2010年
3 贾小敏;多核处理器片上Cache访问行为分析与优化机制研究[D];国防科学技术大学;2011年
4 李静梅;多核处理器的设计技术研究[D];哈尔滨工程大学;2010年
5 吕鸣松;实时系统最坏情况执行时间分析技术的研究[D];东北大学;2010年
6 邓亚丹;面向共享Cache多核处理器的数据库查询执行优化技术研究[D];国防科学技术大学;2009年
7 刘德峰;面向存储级并行的多核处理器关键技术研究[D];国防科学技术大学;2011年
8 所光;面向科学计算应用的多核处理器Cache划分策略研究[D];国防科学技术大学;2009年
9 唐轶轩;面向多线程应用的Cache优化策略及并行模拟研究[D];中国科学技术大学;2012年
10 朱海涛;面向高密度计算的多核处理器结构研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 徐立超;异构多核处理器的任务分配及能耗研究[D];湖南大学;2010年
2 杨鹏飞;多核环境Cache一致性协议研究[D];哈尔滨工程大学;2011年
3 刘瑞;宇航处理器Cache系统的可靠性分析和加固研究[D];上海交通大学;2011年
4 曹皓;多核处理器体系结构下Linux调度机制的研究[D];内蒙古大学;2011年
5 刘文佳;多核处理器Cache一致性研究与设计[D];哈尔滨工程大学;2010年
6 刘佳;多核结构下片内存储系统的模型模拟技术研究[D];国防科学技术大学;2010年
7 乔福明;多核架构下LLC很少重用块的研究[D];浙江工业大学;2011年
8 石文强;多核Cache替换策略模型研究[D];国防科学技术大学;2011年
9 景涛;多核环境下基于L2 Cache的目录一致性协议的研究[D];哈尔滨工程大学;2010年
10 贾权;65nm L1 D-Cache中DCA的全定制设计与实现[D];国防科学技术大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026