收藏本站
《国防科学技术大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

DSP高效片内二级Cache控制器的设计与实现

刘胜  
【摘要】: 数字信号处理器(DSP)在近年来得到广泛的发展及应用。“Cache+RAM”的存储结构已经成为高性能DSP设计中不可或缺的技术之一。二级Cache控制器的设计是“两级Cache+RAM”存储结构中的关键环节。如何设计和实现一个正确、高效同时又满足高频要求的二级Cache控制器是一个值得研究的问题。 FT-CXX是我们自主研发中的一款高性能定点DSP,采用超长指令字(VLIW)技术,一拍内最多可以发射8条指令。预期CPU频率600MHz,外设频率300MHz,二级Cache(L2)的总容量1MB。本文对其中的L2控制器的设计和实现技术进行了研究,主要工作和贡献集中体现在以下几个方面: 首先,分析了一般的Cache的设计方法,全面考察了主流DSP芯片中Cache的性能要求和实现技术,设计实现了FT-CXX L2的Cache/SRAM结构,确定了L2数据体、Tag体的结构及地址访问规则,设计实现了L2Cache的映象规则、替换算法、写策略等。 其次,针对L2存储容量大、存储体只能支持CPU频率一半的事实,采取措施优化对一级Cache(L1D和L1P)缺失的处理。1)设计了缺失流水线,理想情况下平均每个L1的缺失代价只有两拍;2)在L1D和L2之间设计了一个宽度为64bit,深度为4且支持写合并的L1D写缺失缓冲队列,有效地减少了L1D写缺失的等待时间;3)提出了跨边界访问问题的解决方案,该方案具有效率高、硬件开销小且不会增加编译器的额外负担等特点。 再次,设计并实现了一种高效的L2 SRAM的EDMA访问的处理机制。该机制充分挖掘了EDMA访问潜在的并行性,综合采用了EDMA请求猝发(可以连续发8个读请求,4个写请求)、侦听和数据发送处理流水化、基于侦听历史的侦听次数减少、基于旁路和归并机制的L2数据体访问的削减等技术,使EDMA的传输效率大大提高,平均访问一个数据只需要2-3拍,和一般的串行通路相比,加速比在2.0以上。 最后,设计并实现了高效的数据一致性维护机制。一方面提供了丰富的Cache控制寄存器操作,另一方面对侦听和数据写回进行了分类处理。实验结果表明,该机制使系统典型请求的开销降低了10%以上。 此外,本文对以上设计进行了较为系统地验证,并进行了逻辑综合和优化,使其在SMIC 0.13 um工艺下满足与一级Cache的接口部分工作频率为600MHz,内部的工作频率为300MHz的要求。
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP368.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前3条
1 李闻博;FT-Matrix处理器指令集与指令派发设计[D];国防科学技术大学;2010年
2 靳强;“银河飞腾-DX”DSP高效二级cache的设计与实现[D];国防科学技术大学;2011年
3 付波;基于dsp的两级cache低功耗研究与实现[D];南昌大学;2012年
【参考文献】
中国期刊全文数据库 前2条
1 杨文华,罗晓沛;专用集成电路的设计验证方法及一种实际的通用微处理器设计的多级验证体系[J];计算机研究与发展;1999年06期
2 刘胜;陈书明;;多级存储系统中跨边界访问实现策略研究[J];计算机工程与设计;2008年11期
【共引文献】
中国期刊全文数据库 前10条
1 王恒娜;访问局部性原理在Cache系统优化及设计中的应用[J];安徽师范大学学报(自然科学版);2004年04期
2 宋静,姚晟;计算机性能评价与测试的主观误区研究[J];安庆师范学院学报(自然科学版);2005年01期
3 汤伟;黄永灿;;单芯片多处理器中Cache一致性的分析[J];安阳师范学院学报;2009年02期
4 代少升,张跃;提高红外焦平面阵列实时非均匀性校正速度的研究[J];半导体光电;2005年05期
5 代少升;张跃;;红外图像实时显示技术研究[J];半导体光电;2006年01期
6 代少升;张跃;刘文煌;;基于DSP的红外实时成像系统的研制[J];半导体光电;2006年04期
7 代少升;张跃;刘文煌;;利用DSP实现IRFPA非均匀性校正及其关键技术研究[J];半导体光电;2006年05期
8 代少升;;红外焦平面阵列非均匀性实时校正研究[J];半导体光电;2009年04期
9 吴杰,宋国文,陈维军;用TMS320C6201实现H.263编译码系统[J];半导体技术;2002年12期
10 黄红兵,殷小贡,黄丽云;TMS320C2XX开发设计中应注意的问题[J];半导体技术;2003年10期
中国重要会议论文全文数据库 前10条
1 吴玮;陈小惠;潘树国;;基于DSP的GPS导航解算实时性研究[A];第二届中国卫星导航学术年会电子文集[C];2011年
2 孙鹏;赵保军;高梅国;;基于TMS320C62x的雷达信号处理系统[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 郭存锁;宋鹏;;基于DaVinci的H.264视频解码器设计与算法研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 李江;于凤芹;张贞凯;;TI C67x DSP应用系统软件设计的代码优化方法[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
5 王琴;袁嗣杰;;H.264图像压缩编码技术在综合信息传输平台中的应用[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
6 赵丹培;刘尊言;姜志国;;空间目标的多DSP实时测量仿真系统[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
7 王美玲;曹彦岗;刘伟;;低成本车载GPS/DR组合导航系统的研究[A];先进制造技术论坛暨第三届制造业自动化与信息化技术交流会论文集[C];2004年
8 翟艳东;于明;艾艳锦;;一种基于DSP的虹膜门禁系统设计方案[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
9 和巍;林涛;;基于数字信号处理器的电能质量在线监测装置方案设计[A];中南七省(区)电力系统专业委员会第二十二届联合学术年会论文集[C];2007年
10 华学明;吴毅雄;张勇;焦馥杰;;数字信号处理器在焊接电源中的应用前景[A];第五届21世纪中国焊接技术研讨会论文专刊[C];2003年
中国博士学位论文全文数据库 前10条
1 何义;流体系结构指令管理及系统虚拟化仿真技术研究[D];国防科学技术大学;2010年
2 肖杨;基于软件无线电的编码激励超声血流检测系统的研究[D];复旦大学;2010年
3 伍湘君;GRAPES高分辨率气象数值预报模式并行计算关键技术研究[D];国防科学技术大学;2011年
4 郭御风;面向多核微处理器芯片的高效能I/O体系结构及其实现技术[D];国防科学技术大学;2010年
5 滕云田;现代地震地磁观测技术研究[D];中国地震局地球物理研究所;2001年
6 刘嘉;弧焊逆变电源的数字化控制[D];北京工业大学;2002年
7 姜成山;转基因微细作业系统中超微量注射及双目时分立体成像技术的研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2002年
8 肖志涛;基于相位信息的图像特征检测和基于DSP的图像匹配处理机的研究[D];天津大学;2003年
9 宋辉;量子计算机体系结构及模拟技术的研究与实现[D];中国人民解放军国防科学技术大学;2003年
10 徐元欣;有线数字电视信道接收芯片的实现研究[D];浙江大学;2003年
中国硕士学位论文全文数据库 前10条
1 郑莉;DSP在集装箱加强板焊接定位系统中的应用[D];山东科技大学;2010年
2 朱高杰;基于达芬奇技术的玻璃缺陷在线检测系统的设计[D];郑州大学;2010年
3 刘振飞;图像预处理算法的硬件实现[D];哈尔滨工程大学;2010年
4 程鹏;图像声纳发射与控制模块的设计与实现[D];哈尔滨工程大学;2010年
5 陶涛;雷达信号分选跟踪器的设计与实现[D];哈尔滨工程大学;2010年
6 张晶明;基于达芬奇技术的水声图像处理研究[D];哈尔滨工程大学;2010年
7 程伟;被动高精度测向技术研究[D];哈尔滨工程大学;2010年
8 高璎园;轨道车辆平轮实时检测技术研究[D];哈尔滨工程大学;2010年
9 赵胜;高速高保真H.264编码器的设计及移植[D];大连理工大学;2010年
10 徐海洋;基于ADSP-BF533的非侵入式高效电机监测系统[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王恒娜;访问局部性原理在Cache系统优化及设计中的应用[J];安徽师范大学学报(自然科学版);2004年04期
2 汤伟;黄永灿;;单芯片多处理器中Cache一致性的分析[J];安阳师范学院学报;2009年02期
3 殷婧;;Cache结构的低功耗可重构技术研究[J];单片机与嵌入式系统应用;2009年01期
4 沈立,王志英,鲁建壮,戴葵;基于控制流的混合指令预取[J];电子学报;2003年08期
5 吴佳骏;冯晓兵;张兆庆;;非线性规律访存操作的数据预取技术[J];计算机研究与发展;2007年02期
6 周学海;余洁;李曦;王志刚;;基于指令行为的Cache可靠性评估研究[J];计算机研究与发展;2007年04期
7 汪东;陈书明;;DSCF:一种面向共享存储多核DSP的数据流分簇前向技术[J];计算机研究与发展;2008年08期
8 杨文华,罗晓沛;专用集成电路的设计验证方法及一种实际的通用微处理器设计的多级验证体系[J];计算机研究与发展;1999年06期
9 杨可;樊晓桠;王党辉;;多核多线程处理器二级Cache预取结构的设计[J];计算机工程与应用;2009年10期
10 靳强;郭阳;鲁建壮;;一种步长自适应二级cache预取机制[J];计算机工程与应用;2011年29期
中国博士学位论文全文数据库 前6条
1 肖勇;值预测技术研究[D];国防科学技术大学;2005年
2 鲁建壮;单芯片多处理器关键技术的研究与实现[D];国防科学技术大学;2005年
3 万江华;基于超长指令字处理器的同时多线程关键技术研究[D];国防科学技术大学;2006年
4 阳晔;面向嵌入式处理器的代码压缩研究[D];浙江大学;2007年
5 马鹏勇;CMT处理器高速缓存的优化技术[D];国防科学技术大学;2007年
6 汪东;异构多核DSP数据流前瞻关键技术研究[D];国防科学技术大学;2007年
中国硕士学位论文全文数据库 前3条
1 赖明澈;数据并行协处理器体系结构的研究与实现[D];国防科学技术大学;2005年
2 段博海;银河飞腾DSP模拟验证平台的设计与实现[D];国防科学技术大学;2006年
3 傅祎晖;高性能DSP一级Cache缺失流水设计与实现[D];国防科学技术大学;2009年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 张霁;基于Android系统的低功耗底层驱动研究[D];西安电子科技大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 李健航,潘孝梅;Pentium体系结构简介[J];微型机与应用;1994年10期
2 戴梅萼,史嘉权;计算机系统存储体设计技术的探讨[J];微型机与应用;1995年03期
3 周军;病毒能藏在CMOS和CACHE中吗?[J];电脑爱好者;1998年12期
4 尚毅,向旭光;怎样使奔腾586奔起来[J];实验技术与管理;1996年02期
5 周翚,侯滨;Proxy Server中Cache的管理和使用[J];现代计算机;2000年01期
6 陈文革,程向前;高速地址CACHE——散列表的应用[J];微型机与应用;2002年03期
7 钟永锋,张江陵;RAID阵列中高速Cache管理的优化[J];计算机与数字工程;1998年05期
8 王湘娜,蒋本珊,徐渐;基于RAID5的磁盘阵列Cache的研究与实现[J];计算机工程;2003年03期
9 王宇江,王晶洁;PC机系统的优化[J];黄金学报;1996年03期
10 张震,饶光,唐戎;Web Cache技术及其在电信运营商中的应用[J];电信建设;2004年02期
中国重要会议论文全文数据库 前10条
1 石文强;倪晓强;金作霖;张民选;;Cache动态插入策略模型研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
2 邓亚丹;吴京;熊伟;景宁;;基于共享cache多核处理器的数据库内存排序优化[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 郑涵;吴英;丁晓东;乐嘉锦;;基于Web的个性化智能Cache库[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 张承义;郭维;周宏伟;;Cache漏流功耗的自适应优化:动态容量调整[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
5 李凡;李建中;何震瀛;;XML数据Cache策略研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
6 尹飞;吴磊;;基于功能覆盖率验证多核处理器中的Cache一致性协议[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
7 唐常杰;相利民;熊明;熊岚;;DBMS的专用CACHE技术[A];第十届全国数据库学术会议论文集[C];1992年
8 石胜飞;李建中;王朝坤;;分布式移动数据库CACHE一致性管理的研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 周旋;冯玉才;李碧波;孙小薇;;多服务器DBMS的Cache管理[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年
10 杨旭;骆祖莹;韩银和;;基于cache内容替换的系统管理模式漏洞检测方法[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
中国重要报纸全文数据库 前10条
1 ;我们访问到了吗?[N];中国高新技术产业导报;2000年
2 晓文;263与CacheFlow建立“互联网加速技术”联盟[N];通信产业报;2000年
3 主持人:李健;加速只为互联[N];网络世界;2000年
4 本报记者 张欣;为互联网“加速”[N];计算机世界;2000年
5 张燕;263网络集团携手CacheFlow共塑全新互联网运营模式[N];中国信息报;2000年
6 李军;合理利用 网尽其能[N];中国计算机报;2002年
7 雅鼠;明天的赛扬会怎样[N];中国计算机报;2002年
8 霖言;CPU性能路上的赛跑[N];中国信息报;2002年
9 山东青州 刘福浩 赵洪奎;让光驱运行得更快[N];中国电脑教育报;2004年
10 ;全“芯”世界——CPU[N];电脑报;2001年
中国博士学位论文全文数据库 前10条
1 所光;面向科学计算应用的多核处理器Cache划分策略研究[D];国防科学技术大学;2009年
2 贾小敏;多核处理器片上Cache访问行为分析与优化机制研究[D];国防科学技术大学;2011年
3 唐轶轩;面向多线程应用的Cache优化策略及并行模拟研究[D];中国科学技术大学;2012年
4 项晓燕;体系结构级Cache功耗优化技术研究[D];浙江大学;2013年
5 邓亚丹;面向共享Cache多核处理器的数据库查询执行优化技术研究[D];国防科学技术大学;2009年
6 赵天磊;微处理器Cache访问行为分析技术研究[D];国防科学技术大学;2011年
7 洪兴勇;高性能BWDSP处理器指令Cache研究与设计[D];合肥工业大学;2013年
8 李硕;多核处理器下多级Cache多维度联合划分策略[D];吉林大学;2013年
9 吕鸣松;实时系统最坏情况执行时间分析技术的研究[D];东北大学;2010年
10 李功明;片上多处理器体系结构中Cache一致性模型研究[D];中国科学技术大学;2013年
中国硕士学位论文全文数据库 前10条
1 刘清;嵌入式系统中低功耗可重构Cache的研究与设计[D];湖南大学;2012年
2 李冬妮;嵌入式系统中低功耗Cache的重构技术研究[D];湖南大学;2012年
3 贾权;65nm L1 D-Cache中DCA的全定制设计与实现[D];国防科学技术大学;2010年
4 王震;CMP架构下的共享Cache动态划分[D];吉林大学;2011年
5 张林;基于P2P Cache技术的互联网优化方案设计[D];北京邮电大学;2011年
6 胡涛;面向存储器完整性验证的Cache设计[D];华中科技大学;2011年
7 董磊;实时操作系统中共享Cache划分技术的研究与应用[D];中国科学院研究生院(沈阳计算技术研究所);2012年
8 叶英;众核片上私有型末级Cache共享化架构设计与实现[D];上海交通大学;2013年
9 张杰;基于CMP的共享L2Cache管理策略研究[D];哈尔滨工程大学;2013年
10 王利杰;基于视频场景的带宽感知Cache模型和划分策略[D];华中科技大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026