收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

SIMD数据置换指令的自动生成与优化

陈向  
【摘要】:为了提高多媒体、编码/解码、加密/解密等计算密集型应用的性能,越来越多的现代微处理器中集成了SIMD(Single Instruction Multiple Data)功能单元,并向原有的指令集中增加了SIMD扩展指令,以充分挖掘这些应用中蕴含的丰富数据级并行。 在理想情况下,SIMD指令能够带来很高的性能加速比,但是目前编译器对SIMD指令的利用并没有达到足够令人满意的程度,其主要原因有两个:一是SIMD指令都是寄存器-寄存器型的,操作数的宽度必须与向量寄存器的宽度一致;二是绝大多数SIMD访存单元仅支持地址连续、对齐(aligned)的存储访问。如果实际应用无法满足这两个条件,就必须插入数据置换(permutation)指令,对参与运算的数据进行重新组织,以得到符合SIMD指令要求的操作数。然而,数据置换指令的加入会带来不小的性能损失,降低程序的执行效率。本文研究并提出了减少这种性能损失的方法,并将其集成到SIMD指令的自动生成编译框架中。 通过分析现有的数据置换指令自动生成和优化方法,不难发现现有的编译策略都将置换指令的生成和优化分为两个阶段,第一个阶段生成置换指令,但其中有不少是冗余的,第二阶段再尽可能地将这些冗余的置换指令优化掉,但优化效果往往无法令人满意。 为了解决这些问题,本文首先提出了一种新的中间表示URSS(Unified Representation for Scalar and SIMD),它能够将标量指令和SIMD指令的表示统一起来。基于这种中间表示,本文设计并实现了一种自动向量化算法,在向量化的过程中仅生成非冗余的置换指令,而将其他置换指令表示为数据流图中的冲突边。最后本文提出了冲突边的识别和消除算法。上述工作已经在基于SUIF2的编译框架上实现。面向核心程序和MiBench基准程序包的测试结果表明,我们提出的方法大大减少了数据置换指令带来的性能损失。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郭阳;丁伟;李振涛;;高性能算术SIMD模块的电路设计[J];微电子学与计算机;2010年09期
2 侯永生;赵荣彩;高伟;朱嘉枫;;SIMD扩展部件数据依赖关系约束条件研究[J];信息工程大学学报;2014年01期
3 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期
4 周西汉,刘勃,周荷琴,袁非牛;一种基于奔腾SIMD指令的快速背景提取方法[J];计算机工程与应用;2004年27期
5 张倩;;二维SIMD结构的低功耗调度[J];计算机工程;2009年10期
6 魏帅;赵荣彩;姚远;侯永生;;面向SIMD的数组重组和对齐优化[J];计算机科学;2012年02期
7 张武健 ,邱晓海 ,周润德 ,陈弘毅;A New Implementation of the Post-Stage Tasks of Motion Estimation Using SIMD Architecture[J];Tsinghua Science and Technology;2001年04期
8 李俊山,李莉,沈绪榜,焦康;图象理解SIMD计算机的设计技术[J];小型微型计算机系统;2002年09期
9 王馨梅,张发存,崔杜武;SIMD计算机的面向对象仿真方法[J];计算机工程;2005年17期
10 李初辉;王伟;肖玮;;一种共享主存二维SIMD结构资源分配算法的改进与实现[J];计算机工程与科学;2008年09期
11 付光远;;基于SIMD-MPP并行模型的图像调度与映射方法研究[J];微电子学与计算机;2006年S1期
12 王晔;臧斌宇;朱传琪;;二维SIMD体系结构研究与模拟器实现[J];计算机工程与应用;2007年25期
13 欧建林;蔡骏;林茜;;基于SIMD的似然率快速算法[J];计算机工程;2009年13期
14 孙其梅;岳文元;;SIMD机器的互连网[J];计算机研究与发展;1982年03期
15 陈国良;沈鸿;;在SIMD机器上实现的双调选择算法[J];计算机研究与发展;1988年01期
16 ;ALGORITHMS AND ARCHITECTURE IMPLEMENTATIONS OF MIMO OFDM BASEBAND RECEIVER BASED ON THE SIMD DSP CORE[J];Journal of Electronics;2006年05期
17 顾丽红;魏海蕊;;基于龙芯SIMD技术的AES加解密优化[J];计算机工程;2009年03期
18 陈世淼;郭绍忠;陈建勋;王磊;;一种基于SIMD功能部件处理器的三角函数性能优化算法[J];信息工程大学学报;2011年01期
19 陈向;沈立;李家文;;SIMD数据置换操作的自动生成和优化[J];计算机科学;2011年05期
20 桑红石,沈绪榜,陈朝阳;LS SIMD阵列微处理器控制信号时序分析[J];小型微型计算机系统;2001年12期
中国重要会议论文全文数据库 前8条
1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
2 付光远;;基于SIMD-MPP并行模型的图像调度与映射方法研究[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD体系结构的数据相关控制语句转化方法[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
4 朱明慧;;ADI浮点DSP软件编程中的指令并行与SIMD应用[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
5 李彦洁;庞一;孙立峰;;多视点视频编码中的SIMD优化研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四届中国卫星导航学术年会论文集-S7 北斗/GNSS用户终端技术[C];2013年
7 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
8 张科勋;李勇;郭海勇;;一种半定制与全定制相结合的SIMD乘法器设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
中国博士学位论文全文数据库 前5条
1 张为华;共享主存多SIMD结构编译优化及结构研究[D];复旦大学;2006年
2 李玉祥;面向非多媒体程序的SIMD向量化方法及优化技术研究[D];中国科学技术大学;2008年
3 朱嘉华;SIMD编译优化方法研究[D];复旦大学;2005年
4 姜伟华;针对实际多媒体程序和多媒体扩展指令集的SIMD编译优化[D];复旦大学;2005年
5 魏帅;面向SIMD的向量化算法及重组技术研究[D];解放军信息工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 张倩;二维SIMD结构的低功耗调度[D];复旦大学;2008年
2 杨明;基于存储访问的SIMD优化技术研究[D];解放军信息工程大学;2011年
3 刘楷;基于SIMD结构的高性能DSP处理器评测程序的优化与实现[D];西安电子科技大学;2012年
4 陈向;SIMD数据置换指令的自动生成与优化[D];国防科学技术大学;2010年
5 彭永克;基于SIMD架构的二维DCT/IDCT变换电路模块的设计与实现[D];上海交通大学;2008年
6 肖玮;二维SIMD结构的编译优化与功耗研究[D];复旦大学;2008年
7 王迪;SIMD编译优化技术研究[D];浙江大学;2008年
8 高伟;面向SIMD的自动向量化优化技术研究[D];解放军信息工程大学;2013年
9 郝云龙;反馈指导的SIMD向量识别及优化技术研究[D];解放军信息工程大学;2011年
10 赵常智;支持SIMD的DSP编译优化技术的研究与实现[D];国防科学技术大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978