基于多核集群的并行离散事件仿真性能优化技术研究
【摘要】:随着仿真应用的不断深入,系统仿真规模越来越大,个体模型复杂度越来越高,使得仿真系统对计算资源的需求不断增加,如何缩短大规模仿真系统的运行时间,提高仿真应用的效率,是并行离散事件仿真领域目前研究的热点问题。而随着多核计算革命的兴起,通用的多核CPU并行方式正成为当前主流的发展趋势。多核CPU同一片上的多个核之间的低通信延迟能够提供可观的性能潜力。然而,目前在多核集群上运行的仿真系统由于大多沿用以往传统集群上的并行仿真技术,虽然能取得一定的并行加速比,但仍然难以充分发挥多核处理器的性能潜力,因此,开展基于多核集群的并行离散事件仿真性能优化技术研究,对于充分发挥多核处理器的性能潜力,提高仿真应用的运行效率,促进我国大规模仿真应用的发展等具有十分重要的理论和实践意义。
论文针对当前并行离散事件仿真系统难以有效利用多核计算资源的问题,以进一步提高并行离散事件仿真应用运行效率为根本目标,对时间管理算法、负载平衡、共享状态属性访问机制、通信优化等影响并行离散事件仿真性能的关键问题进行了深入研究,主要工作和创新点如下:
(1)提出了支持多核多线程与MPI相结合并行模式的多核集群并行仿真时间管理机制。仿真时间同步是决定并行离散事件仿真运行性能的核心因素。多线程并行调度方式能够充分发挥多核处理器共享内存地址空间低通信延迟的优势,但目前的仿真引擎在多核多线程与MPI相结合的并行模式方面缺乏高效的同步支持。论文针对此问题,在深入分析并行离散事件仿真多线程并行调度机制和分布式同步算法的基础上,提出了支持多核多线程与MPI相结合并行模式的多核集群并行仿真时间管理机制,该机制采用经修改的Mattern算法以适应多线程和MPI异构的并行方式,通过一个有限状态机对每个消息事件的生命周期及状态转换过程进行管理,通过设计无锁的事件状态修改机制来避免锁开销。实验结果表明,在合理的运行配置下,所提出的并行仿真时间管理机制在多核集群上随计算节点数目的增加表现出良好的并行加速比;当仿真实体的核间交互概率达到40%以上时,相对多进程MPI并行方式的加速比可达到1.8左右。
(2)提出了并行离散事件仿真系统在多核处理器上自动负载平衡的事件调度机制。在并行离散事件仿真系统中,负载平衡影响着同步和通信开销,从而影响着整个系统的运行性能。当前的并行仿真动态负载平衡机制很难达到事件调度开销小和负载平衡能力强兼得的目标。论文针对此问题,提出了一种基于分布式队列的全局调度机制,该机制通过全局调度方式来达到动态负载平衡,为降低全局调度开销,该机制设计了分布式的事件队列结构和无锁的事件数据结构;实验结果表明在采用传统算法回滚量较大或难以实现动态负载平衡的情况下,基于论文提出的机制不仅事件调度开销小,而且回滚率能够降低10%~80%,体现了良好的负载平衡能力。
(3)提出了多核环境下并行离散事件仿真系统基于事务内存的共享属性访问机制。并行离散事件仿真系统中往往存在大量的状态数据通信,这种大量的通信容易导致仿真系统性能下降。目前的共享属性通信机制大多采用对象代理技术,不能充分发挥多核处理器共享内存地址空间低通信延迟的优势。论文针对此问题,设计了基于事务内存的共享属性访问机制PDES-STM。该机制根据并行离散事件仿真的特点将每个仿真事件对应成一个事务,仿真事件并发执行时对共享状态属性访问的正确性由事务内存系统中的冲突检测与解决机制来保证。实例分析结果显示PDES-STM能够有效减少内存开销和消息数目;在测试平台上的运行结果表明论文提出的PDES-STM相对基于消息实现的“拉”方式访问机制的性能优势随外部属性访问概率的增大而越来越明显。
(4)提出了多核集群上的并行仿真系统通信延迟隐藏算法。通信延迟是制约分布式计算环境下仿真可扩展性和性能提高的主要因素之一。目前对大规模细粒度模型的仿真应用在并行与分布环境下的通信优化技术尚不能达到足够的通信延迟隐藏,针对此问题,论文提出了“以计算换通信”的优化的B+2R延迟隐藏算法—O(B+2R)算法,该算法依据网络传输时间选取合理的R值,通过对接收到的落伍的实体状态值追加R个时间步的计算来隐藏通信延迟,从而获得更多的并发性。理论分析显示,在合理的配置下该算法可以实现完全的“通信延迟隐藏”。同时,针对CPU和GPU各自的特点,将O(B+2R)算法扩展到GPU平台设计了B+2(R×r)算法。实验结果表明论文提出的通信延迟隐藏机制能够隐藏更多的通信延迟,在合理的运行配置下性能可提高40%以上,可以用于平衡多核集群各种层次上的计算资源之间的计算和通信开销。
在上述研究成果的基础上,论文在Musik仿真引擎的基础上设计并实现了基于多核集群的层次式并行离散事件仿真框架;并通过突发公共事件条件下的民意趋势模型对其在多核集群上进行了综合测试,结果表明所采用的优化技术使得整体仿真系统性能提高了45%左右,并且显现出良好的可扩展性。
|
|
|
|
1 |
朱岭,周政,于景元;离散事件系统状态反馈控制的几何理论[J];控制与决策;1991年01期 |
2 |
郑蓓蓉,周宏明,薛伟;敏捷制造环境下调度理论初探[J];浙江水利水电专科学校学报;2002年02期 |
3 |
胡奇英;离散事件动态系统中的控制综合问题[J];控制理论与应用;1994年05期 |
4 |
疏松桂,谭民;串行离散事件动态系统的建模、分析及设计[J];控制与决策;1994年01期 |
5 |
吴哲辉;DEDS控制理论模型──受控Petri网的网论语义[J];山东矿业学院学报;1995年04期 |
6 |
马继东,李淑红,葛安华;离散事件系统仿真软件综述[J];森林工程;2003年04期 |
7 |
古天龙;考虑事件并发下离散事件系统的状态反馈控制研究[J];桂林电子工业学院学报;1996年04期 |
8 |
赵崙;计算机模拟仿真及其应用[J];中国科技信息;2005年15期 |
9 |
王龙,郑大钟;线性离散事件动态系统的鲁棒性[J];控制理论与应用;1990年02期 |
10 |
姜胜兵,黄志同;离散事件动态系统的混合状态模型[J];控制理论与应用;1993年05期 |
11 |
黄全胜,韩曾晋,郭淑艳;离散事件动态系统的扰动分析[J];郑州大学学报(自然科学版);1997年01期 |
12 |
林海凡,李东波,唐敦兵,徐平;生产调度模型及其遗传优化算法[J];兵工自动化;1999年03期 |
13 |
周建成;宋曦轮;;基于关系事件的网络复杂攻击检测技术研究[J];科技导报;2005年12期 |
14 |
徐心和,于海斌;用于离散事件系统研究的代数方法(二)[J];信息与控制;1990年04期 |
15 |
杨小军;郑应平;杨章■;;可控DEDS的几类稳定性问题[J];控制与决策;1992年03期 |
16 |
赵正义,宋文忠;一类DEDS状态反馈控制器综合的新方法[J];自动化学报;1996年05期 |
17 |
马俊,吴又胜;一类DEDS的最优控制与调度[J];咸宁师专学报;1997年03期 |
18 |
徐心和;一类离散事件系统的模型建立与动态分析[J];东北大学学报(自然科学版);1987年03期 |
19 |
郑应平;离散事件动态系统多模型集成控制理论[J];信息与控制;1992年01期 |
20 |
姜胜兵,黄志同;离散事件系统基于混合状态法的数值分析[J];控制理论与应用;1996年01期 |
|