收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于CPU/GPU平台的虚拟化技术研究

朱二周  
【摘要】:动态二进制翻译(Dynamic Binary Translation, DBT)是一个在运行时将一种可执行代码翻译到另一种可执行代码的过程,并且经过翻译与优化的代码将被立即放在目标平台上运行。在很多领域它已被证明是一个非常重要的技术,比如避免在不同平台之间的代码移植所需要的代码重写的工作,优化本地的二进制代码以提高系统的性能,降低硬件的复杂度,提高能源利用效率以及为应用程序提供动态分析等。然而由翻译过程的开销以及翻译后的代码在目标平台上运行的开销组成的系统开销使得动态二进制翻译系统的性能非常差,这个问题一直困扰着很多研究者。于此同时,随着具有强大运算能力的图形处理器(Graphic Processing Units, GPUs)具有可编程功能,很多研究者开始将其当做用于加速通用程序的协处理器。事实上,在很多情况下将通用程序的部分代码放到图形硬件上运行将比其直接在传统CPU上运行获得的效果更好。然而,当前的GPU编程环境都是基于显示编程的,这使得对它们的利用变得困难。于此同时,GPU还不能直接执行通用程序的可执行代码。 为了发挥DBT与GPU的优点同时摒弃它们的缺点,本文提出了一个虚拟执行环境GXBIT。它可将通用程序的可执行代码自动、透明、高效地运行在CPU/GPU平台上。GXBIT是建立在动态二进制翻译器CrossBit基础上的。GXBIT采用两遍执行模式来解决DBT的高开销问题,它将一些耗时较多的任务,比如信息收集、热块提取与分析、代码翻译等,放在初始阶段运行,这样在以后的运行阶段,系统的性能就会明显提升。在介绍GXBIT的实现之前,为了验证两遍执行模式的正确性与可行性,文章首先实现了一个在单独CPU结构下的两遍运行框架SINOF。在SINOF框架下,其第一遍执行是为了收集源可执行程序的在目标平台上对应的可执行代码及其执行信息,然后将经过优化的目标代码及其信相关信息加以保存,以利于以后阶段的运行。依据SINOF的验证结果,GXBIT的第一阶段负责收集二进制顺序代码中的热块及其相关信息,然后生成可以在CPU/GPU上执行的混合代码,为以后的执行做准备。值得一提的是,该虚拟执行环境对那些需要反复运行的计算密集型的程序非常有效。总体而言,本文的贡献点有以下几个方面:1.本文将动态二进制翻译技术与GPU相结合,提出了一个基于两遍执行模式的虚拟执行环境GXBIT。GXIBT可以在不需要源代码的情况下对通用程序的可执行二进制代码进行加速。该虚拟执行环境是建立在CPU/GPU异构平台上的,它充分发挥了动态二进制翻译技术的平台无关性与GPU的高性能的优点,使得以二进制形式存在的通用程序在该虚拟执行环境下自动、透明、高效地运行。 2.为了验证GXBIT虚拟执行环境中所使用的两遍执行模式的可行性,本文首先设计与实现了一种在单独CPU平台上运行的适合于动态二进制翻译的静态优化架构SINOF。该框架能够有效地屏蔽动态二进制翻译过程中用于优化过程的信息收集所带来的开销,以及优化策略的开销,显著提高了动态二进制翻译的性能。 3.为GXBIT引进了一种中间语言GVInst,该中间语言弥补了在CPU上顺序执行的代码与在GPU上并行执行代码之间的鸿沟,促进了二者之间的转换。 4.为了协调CPU与GPU,并使得它们能够发挥各自的性能,文中提出了一系列的解决方案,比如CPU内存与GPU显存之间的数据传递机制,CPU与GPU之间的同步机制,将可在CPU上执行的顺序代码翻译到可在GPU上执行的并行代码的翻译机制等。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王晓红,王旭,王雷,金茂忠;指令集仿真器自动生成技术的研究[J];计算机工程与应用;2003年02期
2 廖继荣,董海涛;嵌入式系统的适应性显式并行指令技术(英文)[J];西北大学学报(自然科学版);2003年06期
3 谢耀滨;蒋烈辉;尹青;张媛媛;朱杰;;虚拟指令集的构建及翻译技术研究[J];计算机工程与设计;2007年14期
4 韩小琨;蒋烈辉;尹青;陈亮;周博;;可重用的指令集模拟器的设计与优化技术[J];计算机工程;2008年07期
5 靳文兵;左琦;;复杂指令集流水线系统设计[J];微电子学与计算机;2012年04期
6 卢怀山;王向红;冼伟铨;;标点符号指令集微控制器内核[J];广西民族大学学报(自然科学版);2007年03期
7 顾士平;华晓勤;王惠斌;;动态可重构指令计算机[J];计算机时代;2008年03期
8 严迎建;杨志峰;任方;;面向专用指令集处理器设计的软硬件协同验证[J];计算机工程;2010年06期
9 陈玉琴;;短讯[J];微电子学与计算机;1989年09期
10 郑和兴;;工艺指令版次管理技术实现[J];计算机与现代化;2006年05期
11 郭利军;;浅谈电视——指令计算机系统分析与研制[J];科技创新导报;2013年02期
12 吕鸣;;基于网络的统一考试指令播报系统的设计[J];中国考试;2012年03期
13 周国卿;我们进入了新时代[J];电子科技;2000年09期
14 王琦;顾瑜;汪东升;;高性能可重构指令集架构模拟技术[J];清华大学学报(自然科学版);2006年01期
15 桑胜田;王进祥;赵新曙;;采用动态译码缓存的高速指令集模拟器[J];计算机工程;2006年18期
16 王军;周学海;;面向ASAP自定义指令生成算法研究[J];计算机工程;2010年19期
17 杨先炬,陈跃跃,郭阳;一种全硬件动态指令翻译模型[J];微电子学与计算机;2005年11期
18 蒋烈辉;焦建华;朱杰;尹青;谢耀滨;;目标代码指令集类型识别中的特征选取[J];计算机工程与应用;2007年17期
19 杨义彬;蒋烈辉;尹青;何红旗;宋彭涛;;面向多目标的指令集模拟技术[J];计算机工程;2009年23期
20 朱孝银;;模拟器指令集扩展的设计与实现[J];计算机应用与软件;2010年02期
中国重要会议论文全文数据库 前10条
1 郑义;赵天磊;唐遇星;窦强;;体系结构模拟器目标指令集扩展技术研究[A];第十六届计算机工程与工艺年会暨第二届微处理器技术论坛论文集[C];2012年
2 单磊;赵天磊;唐遇星;徐炜遐;;并行模拟器中原子指令的高效执行技术研究[A];第十六届计算机工程与工艺年会暨第二届微处理器技术论坛论文集[C];2012年
3 王庆林;邢座程;闵银皮;赵齐;王宏燕;;一款基于Microblaze指令集的64位RISC处理器设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
4 张亮;刘杰;韩文燕;高剑刚;;计算机多媒体加速技术研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
5 方红霞;李华伟;李晓维;;基于指令集的处理器时延测试产生方法[A];第三届中国测试学术会议论文集[C];2004年
6 辛乃军;陈旭灿;孙海燕;阳柳;罗杰;淡孝强;王霁;;基于GCC的高性能DSP Matrix向量指令集扩展[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
7 邹慧兰;程亚奇;兰西柱;晋刚;;基于StarCore SC140实现通信中的viterbi解码[A];第九届全国青年通信学术会议论文集[C];2004年
8 李勇;刘胜;甄体智;;C64x+DSP内核分析及其性能评价[A];第15届全国信息存储技术学术会议论文集[C];2008年
9 张奕;罗惠琼;;一种32位RISC处理器IP核设计[A];2006中国西部青年通信学术会议论文集[C];2006年
10 朱佳辉;张健;侯立刚;吴淞波;吴武臣;;基于FPGA的嵌入式32位RISC微处理器的设计和应用实现[A];第七届北京青年科技论文评选获奖论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 纪金松;基于动态指令集的自适应处理器的关键技术研究[D];中国科学技术大学;2008年
2 张惠臻;可重构指令集处理器设计中的软件重定向关键技术研究[D];中国科学技术大学;2010年
3 吕雅帅;专用指令集处理器定制关键技术研究与实现[D];国防科学技术大学;2009年
4 杨君;专用指令集处理器(ASIP)体系结构设计研究[D];中国科学技术大学;2006年
5 李东晓;系统芯片中媒体增强数字信号处理器核设计研究[D];浙江大学;2004年
6 杨吟冬;面向受限系统的分布式动态二进制翻译器的分析与研究[D];上海交通大学;2012年
7 蔡卫光;媒体数字信号处理器IP核微结构优化研究[D];浙江大学;2011年
8 李剑慧;动态翻译和优化若干关键技术研究[D];复旦大学;2006年
9 朱二周;基于CPU/GPU平台的虚拟化技术研究[D];上海交通大学;2012年
10 张延军;面向特定应用的指令集处理器设计方法研究[D];清华大学;2006年
中国硕士学位论文全文数据库 前10条
1 金鹰翰;基于显式通信指令集的分片式处理器模拟器开发[D];哈尔滨工业大学;2010年
2 李闻博;FT-Matrix处理器指令集与指令派发设计[D];国防科学技术大学;2010年
3 王慧丽;支持仿真/调试的指令派发部件设计与实现[D];国防科学技术大学;2012年
4 陆荣华;专用指令集安全处理器设计与实现[D];复旦大学;2008年
5 易海峰;复杂指令集快速译码设计[D];西北工业大学;2005年
6 吕雅帅;ASIP指令集自动扩展系统的研究与实现[D];国防科学技术大学;2006年
7 肖军;解释型指令集全系统仿真器的设计与实现[D];华中科技大学;2012年
8 林恒杰;对基于ARM Cortex-M3嵌入式系统的仿真[D];上海交通大学;2008年
9 宋光照;ARMv5TE指令集仿真器的设计与实现[D];电子科技大学;2011年
10 王颖;快速可变目标的IA指令集仿真器的初步研究[D];华北电力大学(北京);2006年
中国重要报纸全文数据库 前10条
1 魏俊岭;CPU指令集大荟萃[N];电脑报;2001年
2 本报记者 霍光;龙芯更需要支持而非质疑[N];中国计算机报;2009年
3 明月;SIMD指令在MP3编码中的作用[N];中国计算机报;2002年
4 ;CPU发展史回顾(四)[N];中国计算机报;2004年
5 重庆 瞌睡虫;超频引发CPU“奇症”[N];电脑报;2002年
6 广西 苏驰;影响CPU性能的三要素[N];电脑报;2003年
7 土匀;了解“爱妻”[N];电脑报;2008年
8 张耘;64位,AMD来了![N];中国计算机报;2002年
9 王立伟 周晰;千台龙芯电脑下月首批用户测试[N];第一财经日报;2006年
10 本报记者 李好宇 张晓明;谁敢说龙芯不是国货[N];电脑报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978