收藏本站
《国防科学技术大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

单芯片多核处理器存储优化技术研究

邓林  
【摘要】:以超大规模集成电路芯片晶体管数量持续增长为物质基础,单芯片多核处理器以可扩展性好、设计复杂度低、性能功耗比高等优点,成为当前单芯片处理器体系结构发展的主流。单芯片多核处理器分为同构多核处理器和异构多核处理器两种。无论是同构还是异构多核处理器,在计算性能迅速提升的同时,也带来了多核存储层次多、共享cache竞争和存储带宽受限等技术挑战。围绕这些多核存储问题,本文主要针对不规则存储访问应用开展算法层次的存储优化技术研究、面向不规则存储访问应用和在线事务处理应用开展了多核共享cache体系结构优化技术研究、面向带宽优化的存储控制器调度算法研究。 本文在算法级存储优化方面,首先分析了密集不规则矩阵和稀疏不规则矩阵运算的访存特征,建立了带优先级的重用数据访存模型。再结合异构多核处理器的存储层次性能特点,提出了减少中间临时结果传输、矩阵分块并行计算、多buffer实现计算与数据传输重叠、循环展开隐藏片内存储访问延时、改变数据存放格式减少控制开销和通用处理器核PPE与计算处理器核SPE并行计算提高程序并行性和访存带宽利用率等6种适合不规则矩阵在异构多核处理器上的存储优化技术。最后,利用Cell BE处理器作为测试平台,获得了与单PPE串行运算相比13.51和21.75的加速比。 cache优化方面,本文从cache划分和cache结构两方面进行存储优化。通过分析稀疏矩阵向量乘(SPMV)的访存特征,提出了一种面向数据结构的细粒度cache划分策略。利用多核体系结构模拟器,以Florida大学(UF)的稀疏矩阵测试集中的12个矩阵为测试集,采用细粒度cache划分,可以消除SPMV中可重用向量的容量和冲突失效,同时降低SPMV计算的cache容量需求。本文还提出了一种适合于在线事务处理(OLTP)的软件可控的半透明cache结构。通过分析数据库管理系统的运行模式、存储管理方法和主要数据结构等特征,以及OLTP应用的访存特征,构建了数据分类模型,将访存数据分为放弃型、保护型和自由竞争型三类。最后,在多核体系结构模拟器上,利用半透明cache区别对待三种数据类型,与透明式cache相比,可以使cache失效的下降率达到35%。 存储控制器方面,本文主要研究访存请求调度算法优化。结合不同处理器核之间访存请求的相互影响和存储器的运行特征,提出了一种两阶段访存请求调度算法。该算法不仅考虑了多核间的访存调度的公平性,也考虑了存储带宽的充分利用。第一阶段,为处理器核分配不同的访存优先级,保证高优先级的进程的访存被优先调度执行,以满足进程的实时性。对于相同优先级的访存请求,提出了多核访存公平等待时间评价模型,并基于该模型尽可能的保证它们访存的公平性。第二阶段则面向目前主流的DDR3 DRAM存储器的特点,建立访存请求限制模型,提出了多通道防饿死最小等待时间调度策略。最后,以来自SPEC CPU 2000中的10个测试程序的访存流为测试集,在模拟器上的测试表明,与先到先服务调度(FCFS)相比,减少了33%的访存等待时间,访存加速比达1.49。同时,公平调度也使大部分应用的访存性能下降比在1.1左右。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP332

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前4条
1 马萌;面向程序访存特征的存储优化技术研究[D];国防科学技术大学;2011年
2 肖瑞瑾;多核处理器层次化存储体系研究[D];复旦大学;2012年
3 张杰;基于CMP的共享L2Cache管理策略研究[D];哈尔滨工程大学;2013年
4 黄品丰;面向异构处理器的代价模型及存储优化技术研究[D];解放军信息工程大学;2013年
【参考文献】
中国硕士学位论文全文数据库 前1条
1 万轶;高性能DDR3存储控制器的研究与实现[D];国防科学技术大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 徐力;史少波;王沁;;面向SDR应用的多核DSP低功耗设计[J];电子科技大学学报;2012年01期
2 张戈;张量;杨荣秋;;纳米级工艺下多处理器功耗评估与优化技术[J];中国集成电路;2008年07期
3 隋秀峰;吴俊敏;陈国良;;ARP:同时多线程处理器中共享Cache自适应运行时划分机制[J];计算机研究与发展;2008年07期
4 贾耀仓;武成岗;张兆庆;;指导cache静态划分的程序性能profiling优化技术[J];计算机研究与发展;2012年01期
5 贾小敏;张民选;齐树波;赵天磊;;片上多核Cache资源管理机制研究[J];计算机科学;2011年01期
6 所光;;一种面向多核处理器粗粒度的应用级Cache划分方法[J];计算机工程与科学;2009年S1期
7 所光;杨学军;;多核处理机系统Cache管理技术研究现状[J];计算机工程与科学;2010年07期
8 熊伟;殷建平;所光;赵志恒;;多核处理器面向低功耗的共享Cache划分方案[J];计算机工程与科学;2010年10期
9 所光;杨学军;;面向多线程多道程序的加权共享Cache划分[J];计算机学报;2008年11期
10 宋风龙;刘志勇;范东睿;张军超;余磊;;一种片上众核结构共享Cache动态隐式隔离机制研究[J];计算机学报;2009年10期
中国博士学位论文全文数据库 前10条
1 隋秀峰;高性能微处理器中自适应高速缓存管理策略研究[D];中国科学技术大学;2010年
2 张琦;多核系统中的程序性能优化研究[D];中国科学技术大学;2010年
3 王玉林;多节点容错存储系统的数据与缓存组织研究[D];电子科技大学;2010年
4 林隽民;基于重用距离预测与流检测的高速缓存替换算法研究[D];清华大学;2010年
5 杜建军;共享高速缓存多核处理器的关键技术研究[D];重庆大学;2011年
6 刘德峰;面向存储级并行的多核处理器关键技术研究[D];国防科学技术大学;2011年
7 贾小敏;多核处理器片上Cache访问行为分析与优化机制研究[D];国防科学技术大学;2011年
8 陈小文;同构众核处理器的片上存储管理与同步机制研究[D];国防科学技术大学;2011年
9 赵天磊;微处理器Cache访问行为分析技术研究[D];国防科学技术大学;2011年
10 洪龙;中介真值程度的度量及其在计算机系统结构研究中的应用[D];南京航空航天大学;2006年
中国硕士学位论文全文数据库 前10条
1 王震;CMP架构下的共享Cache动态划分[D];吉林大学;2011年
2 尹巍;多核处理器中最后一级共享高速缓存管理策略研究[D];中国科学技术大学;2011年
3 史林森;基于自主CPU的DDR3系统协同仿真与设计[D];国防科学技术大学;2011年
4 李家文;虚拟机环境下动态Cache划分技术研究与实现[D];国防科学技术大学;2011年
5 马萌;面向程序访存特征的存储优化技术研究[D];国防科学技术大学;2011年
6 蒋宁;嵌入式数据库的缓存优化与实时事务调度[D];浙江大学;2006年
7 陈伟;基于ARM的轻量级TCP/IP协议栈的移植及应用[D];山东轻工业学院;2009年
8 程为;高速铁路异物侵限监控系统设计[D];武汉理工大学;2010年
9 唐夷简;芯片多线程处理器线程调度的性能测试与优化研究[D];国防科学技术大学;2009年
10 黄健;基于多核的多虚拟机计算资源调度系统[D];华中科技大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 隋秀峰;吴俊敏;陈国良;;ARP:同时多线程处理器中共享Cache自适应运行时划分机制[J];计算机研究与发展;2008年07期
2 李建江;刘珍珍;王珏;;基于IBM Cell多核平台的OpenMP数组私有化技术研究[J];计算机研究与发展;2010年08期
3 贾小敏;张民选;齐树波;赵天磊;;片上多核Cache资源管理机制研究[J];计算机科学;2011年01期
4 张旭明;于策;孙济洲;武华北;;Cell BE环境中BF算法并行化及性能优化[J];计算机工程;2010年06期
5 倪亚路;周晓方;;一种新型共享Cache动态划分机制[J];计算机工程;2011年22期
6 所光;杨学军;;面向多线程多道程序的加权共享Cache划分[J];计算机学报;2008年11期
7 冯国富;董小社;胡冰;王旭昊;王恩东;;一种支持多种访存技术的CBEA片上多核MPI并行编程模型[J];计算机学报;2008年11期
8 曹倩;胡长军;张云星;朱于畋;;一种面向非规则引用的Cell多核处理器自适应Cache行策略[J];计算机学报;2011年05期
9 肖瑞瑾;权衡;张家杰;尤凯迪;英彦;虞志益;;适用于多核处理器的扩展寄存器文件设计[J];计算机工程;2012年15期
10 黄国睿;张平;魏广博;;多核处理器的关键技术及其发展趋势[J];计算机工程与设计;2009年10期
中国博士学位论文全文数据库 前6条
1 马红途;OpenMP程序分析及优化技术研究[D];解放军信息工程大学;2009年
2 杜建军;共享高速缓存多核处理器的关键技术研究[D];重庆大学;2011年
3 周杰;合成孔径雷达数据处理应用的细粒度并行算法与结构[D];国防科学技术大学;2010年
4 姚英彪;高性能嵌入式RISC微处理器核设计研究[D];浙江大学;2006年
5 汪黎;面向软件管理片上存储器的编译优化技术研究[D];国防科学技术大学;2009年
6 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前5条
1 石泽文;多核处理器的容错路由与粒度建模研究[D];复旦大学;2011年
2 李鑫;面向事务处理应用的多核共享存储体系结构性能评价[D];国防科学技术大学;2010年
3 雷元武;合成孔径雷达成像处理硬件加速器技术研究[D];国防科学技术大学;2007年
4 苏波;ATLAS在龙芯2F上的访存优化[D];中国科学技术大学;2009年
5 尤凯迪;高性能低功耗多核处理器研究[D];复旦大学;2011年
【二级参考文献】
中国期刊全文数据库 前3条
1 史美萍,窦文华;基于EPLD的PCI总线仲裁器的设计与实现[J];电子技术应用;2000年03期
2 江先阳;刘新春;张佩珩;孙凝晖;徐志伟;;计算密集型体系集成DDR SDRAM控制器设计[J];计算机工程与科学;2006年03期
3 刘瑰 ,朱鸿宇;通用DDR SDRAM控制器的设计[J];微型机与应用;2004年08期
【相似文献】
中国期刊全文数据库 前10条
1 李晋惠;寇立涛;乔永兴;;用软件来提高多核处理器性能的方法分析[J];工业仪表与自动化装置;2010年01期
2 乔保军;石峰;计卫星;;多核处理器核间互连的新型互连网络[J];北京理工大学学报;2007年06期
3 喻之斌;金海;;多核处理器体系结构软件仿真技术:研究综述[J];计算机科学;2007年10期
4 叶群辉;江衍煊;;数据流语言简化并行编程[J];电脑与信息技术;2011年02期
5 司炯;李东生;;基于遗传算法的多处理器系统任务调度[J];微型机与应用;2011年10期
6 章承科;;多核处理器构架的高速JPEG解码算法[J];单片机与嵌入式系统应用;2006年01期
7 邹峰;祝永新;;一种软件事务存储模型的设计和模拟[J];信息技术;2008年09期
8 姚信安;胡世平;宋飞;;多核处理器电压调节模块的研究与实现[J];计算机工程与科学;2009年S1期
9 黄志钢;陶旭东;潘振杰;;一种异构多核处理器体系结构的软件仿真[J];沈阳理工大学学报;2010年06期
10 游佐勇;罗省贤;;多核计算环境下快速排序并行算法的实现[J];电脑与电信;2011年01期
中国重要会议论文全文数据库 前8条
1 郭建军;戴葵;王志英;;一种多核处理器存储层次性能评估模型[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
2 蒋汉平;李腊元;;基于多核处理器的NAT-PT的软件架构的研究[A];中国通信学会第五届学术年会论文集[C];2008年
3 潘送军;胡瑜;李晓维;;多核处理器瞬态故障敏感性分析[A];第五届中国测试学术会议论文集[C];2008年
4 张炜;冯权友;曾超;窦文华;;一种基于光互连技术的存储墙问题解决方案[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
5 卢宇彤;杨学军;所光;;一种面向多核系统的并行计算任务分配方法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
6 计卫星;王永辉;宋红;;一种面向M5的图形化并行模拟技术研究[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
7 所光;杨学军;;双核处理器性能最优的共享Cache划分[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
8 桂亚东;;高效能计算机技术展望[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年
中国博士学位论文全文数据库 前8条
1 李晖;高性能计算机若干关键问题研究[D];中国科学技术大学;2009年
2 杨晓奇;事务存储编程和KD-50-I万亿次机软件库优化的若干问题研究[D];中国科学技术大学;2008年
3 郭建军;同步数据触发体系结构多核处理器存储系统关键技术研究[D];国防科学技术大学;2008年
4 谢铖;多内核构件化嵌入式操作系统的研究[D];浙江大学;2006年
5 陈娟;低功耗软件优化技术研究[D];国防科学技术大学;2007年
6 赖明澈;同步数据触发多核处理器体系结构关键技术研究[D];国防科学技术大学;2008年
7 孙小涓;海量网络流实时处理的优化技术研究[D];中国科学院研究生院(计算技术研究所);2008年
8 扈啸;嵌入式多核处理器在线追踪调试与错误检测关键技术研究[D];国防科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 杨川;MPCore多核处理器并行计算方法的研究与实现[D];西南交通大学;2014年
2 张荫芾;基于多核处理器架构的嵌入式微内核操作系统的研究与设计[D];上海交通大学;2009年
3 陈龚;基于SOPC技术的多核处理器的设计与实现[D];华东师范大学;2010年
4 宋志军;基于多核(多处理单元)的防火墙架构研究与关键技术实现[D];电子科技大学;2009年
5 黄冕;X处理器存储一致性模型的研究与实现[D];国防科学技术大学;2008年
6 倪俊杰;基于SimpleScalar的性能和功耗分析多核模拟器[D];上海交通大学;2008年
7 何进仙;基于多核系统的内存管理研究[D];电子科技大学;2009年
8 潘东;多核环境任务分配问题复杂性及求解模型研究[D];大连理工大学;2009年
9 邹峰;多核处理器的事务存储模型的模拟和编译实现[D];上海交通大学;2008年
10 曹婷婷;基于多核处理器串行程序并行化改造和性能优化[D];西南交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026