收藏本站
《中国科学技术大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

高性能计算机若干关键问题研究

李晖  
【摘要】:高速缓存一致性问题不仅关系着系统的正确性,还对系统的性能有着重要影响。多核处理器的高速缓存一致性协议设计更为复杂和验证更加困难。使用多核处理器构建大规模并行计算系统已经成为主流。在此环境下,高速缓存一致性协议需要处理的一致性事务更多,涉及到处理器芯片内多个高速缓存之间、处理器芯片内高速缓存与片外高速缓存之间、处理器芯片之间的一致性问题等。所以研究多核处理器的高速缓存一致性问题具有重要的学术意义和应用背景。首先,本文对多核处理器中的高速缓存一致性协议进行了研究,重点研究了扩放性较好、能适应多核处理器本身特点的MOESI协议及其实现,并对该协议做出了优化;其次,本文研究了在由多核处理器构建的并行计算系统环境下的高速缓存一致性协议,实验证明本文工作能够有效减少片内高速缓存失效次数(13%到30%)和提高系统性能(运行时间最多能减少30%左右);最后,本文研究了片上高速缓存的包含与非包含策略,提出了一个基于不包含策略的片上高速缓存系统设计,从而提高了片上高速缓存容量的利用率和提升了多核处理器的性能。 高性能计算机是一个国家的重要战略资源,其国产化水平是一个国家综合国力的集中体现。目前采用我国具有完全自主知识产权的龙芯多核处理器构建高性能计算机已经被一些研究单位或机构纳入日程。首先,本文特别针对科学计算领域应用,对龙芯体系结构的多核处理器的片上缓存系统的性能进行了评测,指出了龙芯多核处理器在科学计算领域中的一些性能特点。其次,依此进行了一些设计空间上的探索。实验证明,在某些情况下可以使片上二级高速缓存命中率提高50%以上,等。 高性能计算机的网络,对于机器的整体性能具有至关重要的作用。首先,本文研究了一种先进的新型网络拓朴结构:MPU,研究内容包括其数学模型、网络拓扑、路由算法等。其次,本文从理论上对MPU与当前其他先进高性能计算机网络进行了对比分析。最后,本文还介绍了为MPU所开发的一个大型并行模拟器MPUS的原理、架构、工作流程,等。实验证明,MPU的设计正确,且具有良好的可扩放性。 KD-50-Ⅰ万亿次计算机是首台基于龙芯通用高性能处理器的国产万亿次计算机。首先,本文围绕KD-50-Ⅰ的体系结构设计,研究实现了KD-50-Ⅰ的无盘启动技术、构建了KD-50-Ⅰ的高效操作系统和文件系统、优化了KD-50-Ⅰ通信库,从而提高了系统的性能和可用性,有利于KD-50-Ⅰ的推广应用。其次,本文研究了实际物理学研究中常用到的扫描电子显微成像模拟程序在KD-50-Ⅰ上的应用,并对其进行了优化。本项工作提高了应用程序运行效率,为KD-50-Ⅰ在不同领域的应用提供了示例。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP338

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 吴俨俨;;论新一代高性能计算机网络[J];计算机光盘软件与应用;2012年20期
中国博士学位论文全文数据库 前2条
1 郭桂凯;结构动力重分析算法研究与应用[D];吉林大学;2011年
2 沈悦;基于导航通信多模应用的位置服务技术研究[D];中国科学技术大学;2012年
中国硕士学位论文全文数据库 前3条
1 黄奕微;LSSVR三维节点定位机理与系统研发[D];华南理工大学;2011年
2 杨鹏飞;多核环境Cache一致性协议研究[D];哈尔滨工程大学;2011年
3 刘丽;GPU并行技术在矩阵运算及正则模式分析中的应用[D];华东理工大学;2012年
【参考文献】
中国期刊全文数据库 前8条
1 袁伟,张云泉,孙家昶,李玉成;国产万亿次机群系统NPB性能测试分析[J];计算机研究与发展;2005年06期
2 王焕东;高翔;陈云霁;胡伟武;;龙芯3号互联系统的设计与实现[J];计算机研究与发展;2008年12期
3 宋有泉;高小鹏;龙翔;;嵌入式PCI网卡驱动程序的设计与优化[J];计算机工程;2007年02期
4 张福新;章隆兵;胡伟武;;基于SimpleScalar的龙芯CPU模拟器Sim-Godson[J];计算机学报;2007年01期
5 王海霞;汪东升;李鹏;王惊雷;李崇民;;Reducing Network Traffic of Token Protocol Using Sharing Relation Cache[J];Tsinghua Science and Technology;2007年06期
6 冯昊;吴承勇;;CMP体系结构上非包含高速缓存的设计及性能分析[J];计算机工程与设计;2008年07期
7 杨晓奇;郑启龙;陈国良;张俊霞;;国产万亿次高性能计算机KD-50-Ⅰ的通信优化[J];小型微型计算机系统;2009年08期
8 顾乃杰;李凯;陈国良;吴超;;基于龙芯2F体系结构的BLAS库优化[J];中国科学技术大学学报;2008年07期
【共引文献】
中国期刊全文数据库 前10条
1 李豹;;并行神经元集成在风险评估中的应用[J];安徽工程科技学院学报(自然科学版);2009年04期
2 刘瑜;廖同庆;;现代计算环境下的电磁模拟教学浅议[J];安庆师范学院学报(自然科学版);2011年03期
3 王慧亮;包尚联;陈国耀;;基于多核的并行模拟退火放疗计划优化加速方法[J];北京大学学报(自然科学版)网络版(预印本);2008年01期
4 王慧亮;包尚联;陈国耀;;基于多核的并行模拟退火放疗计划优化加速方法[J];北京大学学报(自然科学版);2008年06期
5 张旭;邱志平;胡举喜;;不确定结构区间特征值上下界的并行解法[J];北京航空航天大学学报;2007年09期
6 王维;赵慧洁;董超;;基于投影寻踪的高光谱图像异常检测并行算法[J];北京航空航天大学学报;2009年03期
7 殷文;;基于频率域高阶有限差分法的正演模拟及并行算法[J];吉林大学学报(地球科学版);2008年01期
8 向令;王鹏;;并行迭代算法的研究及应用[J];成都信息工程学院学报;2007年S1期
9 金丽娜;;CC-NUMA结构计算机含错技术研究[J];长春大学学报;2008年12期
10 翟永;陈杰;刘磊;;基于集群技术的“天地图”运行支持环境设计[J];地理信息世界;2011年04期
中国重要会议论文全文数据库 前10条
1 陈连荣;彭朝晖;;高斯射线声场模型在MPI环境下的并行算法设计[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
2 侯有政;张方;;基于CUDA的动载荷频域识别的并行算法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
3 葛宝珊;刘锋;李旭杰;;积木式多DSP并行处理系统路由算法研究[A];现代振动与噪声技术(第九卷)[C];2011年
4 费广磊;马天宝;宁建国;郝莉;;基于MPI的三维爆炸与冲击问题的动态并行研究[A];第十二届现代数学和力学会议论文集[C];2010年
5 薛笑荣;赵荣椿;张艳宁;曾琪明;;一种并行的SAR图像边缘检测方法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
6 石虎;熊健民;宋庭新;;全主元高斯消去法在有限元并行计算中的应用[A];湖北省机械工程学会设计与传动学会、武汉机械设计与传动学会2008年学术年会论文集(2)[C];2008年
7 姜咏江;;内存分块并行计算机研究[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 范培勤;笪良龙;过武宏;;WKBZ简正波方法的并行实现[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
9 张林;笪良龙;卢晓亭;;采用DSP的射线简正波理论并行算法设计[A];2008年全国声学学术会议论文集[C];2008年
10 曹非;刘志勇;;环连接CMP的缓存一致性协议[A];第15届全国信息存储技术学术会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 张琦;多核系统中的程序性能优化研究[D];中国科学技术大学;2010年
2 廖臣;三维电磁粒子模拟并行算法及其应用研究[D];电子科技大学;2010年
3 陈海勇;网格作业调度关键技术研究[D];解放军信息工程大学;2009年
4 黄永忠;移动代理计算模型及其在分布并行计算中的应用研究[D];解放军信息工程大学;2007年
5 张帆;基于MPI和GPU直流电法和大地电磁法三维正演的并行算法研究[D];中国地质大学(北京);2011年
6 程汤培;地下水流动数值模拟的高效并行计算研究[D];中国地质大学(北京);2011年
7 杨迪;原子及小分子强激光场动力学理论研究[D];大连理工大学;2011年
8 龙柏;并行计算平台上的数据索引技术研究[D];中国科学技术大学;2011年
9 吴超;信息检索中top-k问题的并行算法及优化研究[D];中国科学技术大学;2011年
10 方维;面向数据通信优化的并行程序执行模型[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 吕信;激光能量沉积光路追踪法及其并行化[D];中国工程物理研究院;2009年
2 王佳;并行系统零拷贝通信优化技术的研究[D];辽宁师范大学;2010年
3 景涛;多核环境下基于L2 Cache的目录一致性协议的研究[D];哈尔滨工程大学;2010年
4 王东阳;多智能体调度优化算法研究[D];哈尔滨工程大学;2010年
5 张作阳;基于鲁棒性分析推断三羟基丙醛对两种酶的抑制作用[D];大连理工大学;2010年
6 苏涛;甘油生物歧化生产1,3-丙二醇的混杂非线性动力系统辨识[D];大连理工大学;2010年
7 申俊华;中期火电开机优化的多核并行算法及其应用[D];大连理工大学;2010年
8 郜晓亚;水电站(群)长期优化调度多核并行算法与应用[D];大连理工大学;2010年
9 顾慧;基于异构平台的并行计算性能可视化研究[D];辽宁师范大学;2010年
10 裴保梅;基于物理特征的二维流场的并行拓扑结构分析[D];中国海洋大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王恒娜;浅析访问局部性原理在Cache存储系统中的作用[J];安徽大学学报(自然科学版);2005年01期
2 陈德成,贺向东,王泉,孙京燕;复杂结构快速动力重分析的计算方法[J];北京大学学报(自然科学版);1992年05期
3 刘玉恒;蒲菊华;赫阳;熊璋;;无线传感器网络三维自身定位方法[J];北京航空航天大学学报;2008年06期
4 吕良彬;曹阳;高洵;罗卉;;基于球壳交集的传感器网络三维定位算法[J];北京邮电大学学报;2006年S1期
5 于宁;万江文;马万兴;;无线传感器网络三维抽样定位[J];北京邮电大学学报;2008年03期
6 朱艳;;多核CPU中交叉开关总线的设计[J];电子技术;2010年03期
7 赵志升 ,李桂权;一种基于B/S结构与C/S结构结合的新体系结构[J];电子技术应用;2004年08期
8 戴桂兰;赵冲冲;邱岩;;一种基于球面坐标的无线传感器网络三维定位机制[J];电子学报;2008年07期
9 王东;张金荣;魏延;曹长修;唐政;;利用ZigBee技术构建无线传感器网络[J];重庆大学学报(自然科学版);2006年08期
10 林宏;多处理器系统Cache一致性协议的探讨[J];闽江学院学报;2004年02期
中国博士学位论文全文数据库 前5条
1 姜毅;GNSS接收机高性能跟踪与捕获环路算法研究[D];大连海事大学;2010年
2 李纯莲;药物设计中分子对接优化设计的算法和软件研究[D];大连理工大学;2004年
3 张美艳;复杂结构的动力重分析方法研究[D];复旦大学;2007年
4 王顺绪;特征值问题的并行计算[D];南京航空航天大学;2008年
5 刘海峰;结构静力重分析中若干问题的研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 景涛;多核环境下基于L2 Cache的目录一致性协议的研究[D];哈尔滨工程大学;2010年
2 刘文佳;多核处理器Cache一致性研究与设计[D];哈尔滨工程大学;2010年
3 刘福东;面向MPI程序的进程数据相似性分析与优化技术[D];国防科学技术大学;2010年
4 贾志春;GPU运算在STM模拟中的应用[D];中国科学技术大学;2011年
5 王春霞;PC集群系统的并行开发环境MPI及其程序性能的分析研究[D];郑州大学;2003年
6 王文忠;片内多处理器cache一致性双环结构的模拟与实现[D];国防科学技术大学;2004年
7 郝金华;基于网络微控制器的远程监控系统的设计与应用[D];西安电子科技大学;2006年
8 陈石坤;多核处理器中CACHE一致性协议研究和实现[D];国防科学技术大学;2005年
9 蒋建辉;Zigbee网络的设计与实现[D];苏州大学;2006年
10 贺宁;64位微处理器中数据缓存的设计与实现[D];同济大学;2007年
【二级参考文献】
中国期刊全文数据库 前9条
1 李忠泽,陈瑾,龙翔,李未;基于 Pentium Pro 的高性能 BLAS 的设计与实现[J];北京航空航天大学学报;1998年04期
2 杜旭,顿新平,黄建;一种嵌入式系统驱动架构的分析及实现[J];计算机工程与应用;2004年25期
3 可向民,龚正虎,夏建东;零拷贝技术及其实现的研究[J];计算机工程与科学;2000年05期
4 陈志辉,马捷,陈国良,高帆;用户级通信协议BCL-3对IP协议支持的研究[J];软件学报;2003年09期
5 董春雷,郑纬民;基于Myrinet的用户空间精简协议[J];软件学报;1999年03期
6 李玉成,朱鹏;BLAS的加速方法与实现技术[J];数值计算与计算机应用;1998年03期
7 罗水华,杨广文,张林波,石威,郑纬民;并行集群系统的Linpack性能测试分析[J];数值计算与计算机应用;2003年04期
8 吴少刚,许解峰,杨耀忠,任钢;高性能BLAS在类Beowulf机群系统上的实现[J];小型微型计算机系统;2001年08期
9 胡明昌,史岗,胡伟武,唐志敏;通信对机群并行计算性能的影响[J];小型微型计算机系统;2003年09期
【相似文献】
中国期刊全文数据库 前10条
1 乔保军;石峰;计卫星;;多核处理器核间互连的新型互连网络[J];北京理工大学学报;2007年06期
2 喻之斌;金海;;多核处理器体系结构软件仿真技术:研究综述[J];计算机科学;2007年10期
3 叶群辉;江衍煊;;数据流语言简化并行编程[J];电脑与信息技术;2011年02期
4 司炯;李东生;;基于遗传算法的多处理器系统任务调度[J];微型机与应用;2011年10期
5 章承科;;多核处理器构架的高速JPEG解码算法[J];单片机与嵌入式系统应用;2006年01期
6 邹峰;祝永新;;一种软件事务存储模型的设计和模拟[J];信息技术;2008年09期
7 姚信安;胡世平;宋飞;;多核处理器电压调节模块的研究与实现[J];计算机工程与科学;2009年S1期
8 黄志钢;陶旭东;潘振杰;;一种异构多核处理器体系结构的软件仿真[J];沈阳理工大学学报;2010年06期
9 游佐勇;罗省贤;;多核计算环境下快速排序并行算法的实现[J];电脑与电信;2011年01期
10 王佐;石峰;;基三网络中一种最短路径路由算法[J];北京理工大学学报;2009年05期
中国重要会议论文全文数据库 前8条
1 郭建军;戴葵;王志英;;一种多核处理器存储层次性能评估模型[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
2 蒋汉平;李腊元;;基于多核处理器的NAT-PT的软件架构的研究[A];中国通信学会第五届学术年会论文集[C];2008年
3 潘送军;胡瑜;李晓维;;多核处理器瞬态故障敏感性分析[A];第五届中国测试学术会议论文集[C];2008年
4 张炜;冯权友;曾超;窦文华;;一种基于光互连技术的存储墙问题解决方案[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
5 卢宇彤;杨学军;所光;;一种面向多核系统的并行计算任务分配方法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
6 计卫星;王永辉;宋红;;一种面向M5的图形化并行模拟技术研究[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
7 所光;杨学军;;双核处理器性能最优的共享Cache划分[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
8 桂亚东;;高效能计算机技术展望[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年
中国博士学位论文全文数据库 前9条
1 李晖;高性能计算机若干关键问题研究[D];中国科学技术大学;2009年
2 谢铖;多内核构件化嵌入式操作系统的研究[D];浙江大学;2006年
3 杨晓奇;事务存储编程和KD-50-I万亿次机软件库优化的若干问题研究[D];中国科学技术大学;2008年
4 郭建军;同步数据触发体系结构多核处理器存储系统关键技术研究[D];国防科学技术大学;2008年
5 陈娟;低功耗软件优化技术研究[D];国防科学技术大学;2007年
6 赖明澈;同步数据触发多核处理器体系结构关键技术研究[D];国防科学技术大学;2008年
7 孙小涓;海量网络流实时处理的优化技术研究[D];中国科学院研究生院(计算技术研究所);2008年
8 扈啸;嵌入式多核处理器在线追踪调试与错误检测关键技术研究[D];国防科学技术大学;2007年
9 刘扬帆;硬件事务存储微体系结构及其验证研究[D];浙江大学;2012年
中国硕士学位论文全文数据库 前10条
1 田芳芳;多机系统下数据Cache的设计[D];西北工业大学;2006年
2 张荫芾;基于多核处理器架构的嵌入式微内核操作系统的研究与设计[D];上海交通大学;2009年
3 陈龚;基于SOPC技术的多核处理器的设计与实现[D];华东师范大学;2010年
4 倪俊杰;基于SimpleScalar的性能和功耗分析多核模拟器[D];上海交通大学;2008年
5 宋志军;基于多核(多处理单元)的防火墙架构研究与关键技术实现[D];电子科技大学;2009年
6 何进仙;基于多核系统的内存管理研究[D];电子科技大学;2009年
7 黄冕;X处理器存储一致性模型的研究与实现[D];国防科学技术大学;2008年
8 潘东;多核环境任务分配问题复杂性及求解模型研究[D];大连理工大学;2009年
9 陈石坤;多核处理器中CACHE一致性协议研究和实现[D];国防科学技术大学;2005年
10 邹峰;多核处理器的事务存储模型的模拟和编译实现[D];上海交通大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026