收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

共享主存多SIMD结构编译优化及结构研究

张为华  
【摘要】: 共享主存多SIMD结构是指N×N的处理单元(PE-Processing Element)按一定的拓扑结构连接组成的阵列结构,同行/列各PE之间以SIMD方式工作,多行/列之间并行执行。随着多媒体应用的日益普及和多样化,这些应用对处理器的速度提出了越来越高的要求。传统的采用单独的SIMD结构作为多媒体加速部件或者为专门的应用设计ASIC的方法无法同时满足这些应用处理速度和多样性的要求。共享主存多SIMD结构由于其较强的运算能力和可编程性不仅受到学术界的广泛关注,许多公司,如Mortorala、Intrinsity、Morphotech和Folsom都推出了采用共享主存多SIMD结构作为多媒体加速部件的SOCs。在这些芯片的设计过程中,出于节能和芯片面积的考虑,大部分都对共享主存多SIMD结构加入了多行/列SIMD功能单元共享数据总线和各PE寄存器较少的限制。虽然这些限制简化了芯片设计,但是却给针对共享主存多SIMD结构的编程设置了极大的障碍,也给针对共享主存多SIMD结构的优化技术的研究提出了极大的挑战。 目前虽然针对共享主存多SIMD结构作为多媒体加速部件得到了越来越广泛的应用,但是针对共享主存多SIMD结构编译技术的研究却远远滞后于结构的普及。这种情况造成的直接后果是目前程序员只能用手写汇编的方式为共享主存多SIMD结构编写代码。这种编程方式不仅要求程序员熟悉应用程序,也要求程序员对底层结构有深入了解。程序员不仅要为新的应用编写代码,又要为已有的应用重新编写可在共享主存多SIMD结构上运行的代码,这极大增加了程序员的负担。同时由于没有有效编译优化技术的支持,目前针对共享主存多SIMD结构的研究也不够深入,共享主存多SIMD结构的各种特性与结构整体性能的关系的研究都没有展开。这些都给共享主存多SIMD结构的更广泛应用设置了障碍。这种情况下,针对共享主存多SIMD结构优化技术的研究就显得十分迫切。 虽然共享主存多SIMD结构中,存在SIMD指令级别的并行,但是由于共享数据总线的限制,很多情况下多SIMD功能部件无法并行执行,如何有效减少共享数据总线的竞争对于提高共享主存多SIMD结构的并行性就显得尤为重要。传统的数据复用的算法虽然可以解决类似的问题,但却不能解决共享主存多SIMD结构的问题,主要由于以下几方面的原因: 1.传统的数据复用的算法针对的是标量操作数,而共享主存多SIMD结构的操作数主要是向量。 2.传统数据复用的算法在提高数据复用的时候,只是在一定程度上减少了数据总线的竞争,如何提高数据总线的利用率并没有解决。 3.传统的数据复用的算法主要研究对象是cache,而要减少共享主存多SIMD结构中多SIMD功能单元对总线的竞争,只能提高寄存器的数据复用。而在共享主存多SIMD结构中,每个SIMD功能单元的寄存器数量很少,如何有效解决这个问题,减少数据的换入换出对于提高性能也显得至关重要。 本文在充分分析共享主存多SIMD结构编译优化的障碍的基础上,提出了一种优化方法的框架,该框架通过利用共享总线的广播特性提高共享总线的利用率,通过提高SIMD单元本地寄存器的Locality特性来减少各SIMD功能单元对共享总线的竞争。针对单个SIMD单元寄存器少的特点,提出了一种寄存器分配算法,在满足计算资源利用率的前提下,也尽量满足寄存器分配的需求。针对共享主存多SIMD结构多SIMD单元之间的互连的特性,提出了一种流水线调度的策略,该策略可以有效发掘多媒体程序的流水线级并行。该算法在有效提高并行的同时,极大减少了多SIMD单元对共享数据总线的竞争和本地寄存器的压力。本文介绍的算法已在我们实验室开发的C编译器Agassiz中实现。实验数据显示,这些算法对共享主存多SIMD结构获得很好的加速效果。同时,在编译器的帮助下,我们对共享主存多SIMD结构的一些特性与整体性能的关系进行了深入的分析,如共享主存多SIMD结构的队列规模,执行模式等,并根据实验结果,对共享主存多SIMD的结构设计提出了一些建议。 总而言之,本文的主要贡献在于: 1.从软硬件两个角度对共享主存多SIMD结构编译优化的重点和主要困难进行了系统阐述。从而使得共享主存多SIMD结构编译优化算法有的放矢。针对共享主存多SIMD结构结构提出了有效的自动编译优化的算法。 2.针对共享主存多SIMD结构共享数据总线的特点,提出了一种调度算法,该调度算法利用共享数据总线的特点,在有效减少共享主存多SIMD结构共享数据总线竞争的同时,也极大提高了共享数据总线的利用率。 3.针对共享主存多SIMD结构各SIMD功能单元寄存器少的特点,提出了一种新的寄存器分配算法,该算法极大减少了数据换出的数量,减少了数据总线的竞争。 4.针对共享主存多SIMD结构多SIMD功能单元之间互连的特性和一些多媒体应用程序的特点,提出了一种数据流水线的调度策略,该方法在充分利用流水线并行的基础上,极大的降低了多SIMD功能单元对共享总线的竞争和SIMD功能单元本地的寄存器压力。 5.针对共享主存多SIMD结构的特点,提出了一种基于软件流水线的指令预取策略,该策略可以有效提高数据传输的效率。 6.在进行自动编译优化技术研究的同时,针对共享主存多SIMD结构的特点,对共享主存多SIMD结构进行了深入的结构研究,并根据实验结果,给出了一些针对结构设计的建议。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 汪镭,康琦,吴启迪;基于多元最优信息规划的微粒群优化算法[J];控制与决策;2004年12期
2 夏克文;李昌彪;沈钧毅;;前向神经网络隐含层节点数的一种优化算法[J];计算机科学;2005年10期
3 业宁;孙瑞祥;董逸生;;多拉格朗日乘子协同优化的SVM快速学习算法研究[J];计算机研究与发展;2006年03期
4 刘伯晗;张健;吴丽莹;;液晶空间光调制器的纯相位调制特性研究[J];光学精密工程;2006年02期
5 蒋凌琳;张显全;;基于笔划绘制方法研究概述[J];广西科学院学报;2006年02期
6 寇蔚;孙丰瑞;杨立;;粒子群优化算法用于缺陷的红外识别研究[J];激光与红外;2006年08期
7 郭连喜;王静;刘宇;;两通道软件无线电信道器的优化方法[J];大连海事大学学报;2006年03期
8 陈海花;孟庆春;;基于蚁群算法的语音信号动态时间规划[J];哈尔滨工业大学学报;2006年10期
9 程志刚;张立庆;李小林;吴晓华;;基于Tent映射的混沌混合粒子群优化算法[J];系统工程与电子技术;2007年01期
10 乐庆玲;;基于“stretching”技术的动力学演化算法[J];福建电脑;2007年08期
11 许光泞;俞金寿;;改进遗传算法求解三维集装箱装载问题[J];华东理工大学学报(自然科学版);2007年03期
12 孙凌宇;冷明;彭宣戈;;一种基于元胞自动机的无向图剖分优化算法[J];计算机工程与应用;2008年24期
13 许鸣珠;李申山;潘存治;;基于Kautz模型的优化补偿预测函数控制[J];中国电机工程学报;2009年02期
14 柳玲;胡登宇;李百战;;基于设计结构矩阵的过程模型优化算法综述[J];计算机工程与应用;2009年11期
15 李党;;基于改进遗传算法的供电设备检修计划的优化[J];广东输电与变电技术;2009年04期
16 姚长虹;;一种自适应优化算法在信息安全中的应用[J];现代电子技术;2010年03期
17 王效华;张咏梅;;模糊神经网络变结构算法优化的研究[J];三明学院学报;2010年02期
18 司瑞才;马平;王英;;火电厂厂级负荷优化分配算法的分析[J];仪器仪表用户;2010年04期
19 张雪霞;陈维荣;戴朝华;;带局部搜索的动态多群体自适应差分进化算法及函数优化[J];电子学报;2010年08期
20 王建玉;陈俊伟;王宁;;采用dsDNA-MC优化的非线性系统预测控制[J];计算机工程与应用;2010年31期
中国重要会议论文全文数据库 前10条
1 迟明群;刘若尧;崔斐;栾华华;杨文川;;基于三系数DCT的MPEG-4优化算法研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
2 李彬;毛一之;庞小东;;蚂蚁算法在电力变压器优化设计中的应用研究[A];电工理论与新技术学术年会论文集[C];2005年
3 曹晖;司刚全;张彦斌;贾立新;;基于模糊时序数据挖掘的火电厂制粉系统优化算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
4 陈定;何炳发;;一种新的二进制粒子群算法在稀疏阵列综合中的应用[A];2009年全国天线年会论文集(上)[C];2009年
5 柏文洁;汪秉宏;周涛;;连续极值优化算法在Lennard-Jones团簇优化中的应用[A];全国复杂系统研究论坛论文集(二)[C];2005年
6 王冠军;鹿晓阳;王鹏;;结构动力优化设计发展与展望[A];山东土木建筑学会建筑结构专业委员会2008年学术年会论文集[C];2008年
7 张森;张化光;;一类基于优化算法的神经网络自适应控制器的设计[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
8 蒋征波;陈万米;费敏锐;;RoboCup视觉系统中图像搜索的优化算法研究[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
9 花克勤;;电液伺服阀的动态参数寻优[A];第三届全国流体传动及控制工程学术会议论文集(第二卷)[C];2004年
10 宋申民;于志刚;段广仁;;一种新的基于免疫网络的人工免疫算法[A];2005中国控制与决策学术年会论文集(上)[C];2005年
中国博士学位论文全文数据库 前10条
1 张为华;共享主存多SIMD结构编译优化及结构研究[D];复旦大学;2006年
2 余江;机场扩展终端区的运行优化策略研究[D];西南交通大学;2005年
3 许鑫;细菌觅食优化算法研究[D];吉林大学;2012年
4 赵进慧;膜计算仿生优化算法及应用研究[D];浙江大学;2010年
5 王艳;多目标拟态物理学优化算法及其应用研究[D];兰州理工大学;2011年
6 谭琦;多目标优化算法在多客户批处理机环境下的应用研究[D];中国科学技术大学;2012年
7 张晓明;基于种子传播方式和植物分布演化的种子优化算法研究[D];中国科学技术大学;2011年
8 胡洁;细菌觅食优化算法的改进及应用研究[D];武汉理工大学;2012年
9 曾国强;改进的极值优化算法及其在组合优化问题中的应用研究[D];浙江大学;2011年
10 江敏;贝叶斯优化算法的若干问题研究及应用[D];上海大学;2012年
中国硕士学位论文全文数据库 前10条
1 李博;粒子群优化算法及其在神经网络中的应用[D];大连理工大学;2005年
2 胡小平;近景数字摄影测量方法在工业上的应用研究[D];重庆大学;2005年
3 杨凯尧;精馏生产过程稳态建模及其优化[D];吉林大学;2006年
4 徐志超;智能组合优化平台设计与实现[D];吉林大学;2008年
5 张淑艳;基于约束优化方法的多目标优化算法[D];大连理工大学;2010年
6 张利彪;基于粒子群优化算法的研究[D];吉林大学;2004年
7 万斌;二维钣金排套料的算法研究及软件设计[D];国防科学技术大学;2004年
8 于秀霞;分布式数据查询优化算法的研究与探讨[D];长春理工大学;2005年
9 赵胜敏;基于蚂蚁算法在管理优化方面的研究[D];天津大学;2006年
10 臧丽;多光谱图像配准算法研究[D];南京航空航天大学;2007年
中国重要报纸全文数据库 前10条
1 ;增添硬模块优化算法MCU触控更显优势[N];中国电子报;2010年
2 ;六阵元智能天线解决方案[N];通信产业报;2007年
3 联合证券研究所  执笔:王红兵;几个用于期现套利的股票组合[N];上海证券报;2007年
4 Riverbed科技公司北方区经理 王晓静;Riverbed:提高WAN性能[N];网络世界;2007年
5 本报记者 张旭;东北500千伏电网混成自动电压控制系统通过鉴定[N];东北电力报;2008年
6 范兴川;用基础理论研究推动我国高性能软件技术创新[N];科技日报;2005年
7 浙江大学教授 王树青;自动化在化学工业大有作为[N];中国化工报;2006年
8 南京邮电大学 马国强 毕厚杰;多媒体会议中的H.264编码[N];计算机世界;2006年
9 曹传琪;沪深300指数复制过程中的流动性优化[N];期货日报;2008年
10 傅稷张军 本报记者 李旸;杨云龙:科技创新领跑企业[N];锦州日报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978