收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

应用级checkpointing技术的研究与实现

王攀峰  
【摘要】: 随着系统规模的不断扩大和COTS器件制造工艺的不断发展,高性能计算机面临着严峻的可靠性挑战。应用级checkpointing技术是应对这一挑战的关键技术。但是,当前应用级checkpointing技术面临着性能优势无法充分发挥以及不方便使用的问题。 本文致力于高效易用的应用级checkpointing技术的研究与实现,着重研究了应用级checkpoint的优化保存问题,应用级checkpoint全局状态一致性问题,多checkpoint的总开销最优化问题和应用级checkpointing技术易用性问题。本文的主要贡献可概括为以下几点: 1、针对现有活跃变量分析方法不能对MPI并行程序进行准确分析的问题,我们定义了MPI并行程序进程间和进程内的定值-引用关系,并提出了MPI并行程序活跃变量分析方法——LAMP。LAMP克服了传统活跃变量分析方法既不能区分同一个变量在各进程上不同的活跃性、也不能分析跨进程定值-引用关系的缺点,它是优化应用级checkpoint数据量从而减小checkpoint开销的基础技术。 2、深入研究了应用级checkpoint的优化保存问题。我们首先分析了MPI并行程序计算状态的组成,确定了对其中占主要部分的各进程计算状态进行优化的思想;然后提出了一种基于LAMP的应用级checkpointing技术。实验结果表明该技术能够有效减小checkpoint数据量和减小checkpoint开销。 3、深入研究了全局checkpoint数据的一致性问题。我们提出了一个基于编译分析保持应用级checkpoint数据一致性的新方法。该方法不需要记录checkpointing期间的early或late消息,而是通过静态分析找出MPI程序中安全的checkpointing区域的方法,在安全的checkpointing区内保存应用级checkpoint时不需要记录任何消息。实验证明该方法简单有效。 4、深入研究了多个checkpoint的总开销最小化问题,提出了一种优化设置多个checkpoint位置的方法。由于应用级checkpointing开销主要来自写checkpoint文件的时间,我们首先将求解最小的checkpoint总开销近似为求解最小的checkpoint总数据量。然后将多checkpoint的优化设置问题抽象为一个类似于0-1整数规划的数学问题。最后给出了两种求解算法。 5、针对应用级checkpointing的易用性问题,我们设计并实现了一个源到源的预编译器ALEC,它可以非常方便地将普通的Fortran77/MPI程序转换成具有高效的应用级checkpointing功能的容错程序。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;2011年全国高性能计算学术年会征文通知[J];软件学报;2011年07期
2 杨艳妮;彭道勇;张仕念;殷维刚;张国彬;;军用软件可靠性问题研究[J];电子产品可靠性与环境试验;2009年S1期
3 王左利;;异构平台挑战软件设计[J];中国教育网络;2011年09期
4 王义强;袁修华;马明阳;胡艳娟;;基于神经网络的数控插补容错技术[J];农业机械学报;2011年07期
5 欧阳城添;王曦;郑剑;;自适应一致表决算法[J];计算机科学;2011年07期
6 柴亚辉;沈文枫;张倬;唐振;;Cell BE高性能计算实验平台设计与实现[J];实验室研究与探索;2011年05期
7 宁新建;;航空火控计算机的容错技术分析[J];计算机与网络;2010年17期
8 潘小敏;盛新庆;;电特大目标散射的多层快速多极子高性能计算[J];系统工程与电子技术;2011年08期
9 王珣;;信息化是最具价值资产[J];信息方略;2010年11期
10 徐胜超;;志愿者计算模型的研究进展[J];小型微型计算机系统;2011年08期
11 徐龙;武殿梁;程奂翀;范秀敏;;高性能计算数据远程交互可视化系统研究[J];计算机工程与设计;2011年09期
12 ;业界动态[J];电子世界;2010年10期
13 Jack Dongarra;;下一代计算机系统将由异构平台组成[J];中国教育网络;2011年09期
14 李杨;;微软敲开中国“云市场”大门[J];上海信息化;2011年06期
15 齐记;高笑菲;杨琼;周庆国;;HPC在近物所[J];中国教育网络;2011年09期
16 ;Portland Group推出新一代支持x86平台的NVIDIA CUDA架构编译器[J];电子设计工程;2011年14期
17 ;HP ProLiant SL390s G7高密度GPU计算新宠[J];信息方略;2010年22期
18 赵明明;林卫峰;张宏都;仲崇楠;;高校云计算平台建设的发展趋势[J];实验技术与管理;2011年07期
19 ;创新培养未来——2011英特尔中国大学峰会在大连召开[J];微电脑世界;2011年09期
20 ;中国航天科工集团第二研究院706所简介[J];计算机工程与设计;2011年07期
中国重要会议论文全文数据库 前10条
1 王勇;;应急管理与高性能计算(节选)[A];“广东科协论坛第27期:高性能计算与技术创新”荟萃[C];2009年
2 袁勇;;地下结构高性能计算的挑战[A];首届工程设计高性能计算(HPC)技术应用论坛报告集[C];2007年
3 李根国;吴建成;;高性能计算在工业工程领域的应用和发展[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年
4 ;陈仲驹[A];“广东科协论坛第27期:高性能计算与技术创新”荟萃[C];2009年
5 姜弘道;;高性能计算与水利工程[A];中国力学学会学术大会'2005论文摘要集(下)[C];2005年
6 叶洎沅;;Altair建筑行业CAE创新平台解决方案[A];首届工程设计高性能计算(HPC)技术应用论坛报告集[C];2007年
7 顾国平;周隽;;基于IBM的高性能计算平台解决方案[A];首届工程设计高性能计算(HPC)技术应用论坛论文集[C];2007年
8 赵恒;;达索系统3D PLM加速&扩展企业业务价值[A];首届工程设计高性能计算(HPC)技术应用论坛报告集[C];2007年
9 陈岱林;;前言[A];首届工程设计高性能计算(HPC)技术应用论坛论文集[C];2007年
10 王爱英;张倩芸;;基于GPU的高性能计算及在矩阵运算中的应用[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 王攀峰;应用级checkpointing技术的研究与实现[D];国防科学技术大学;2008年
2 杜云飞;容错并行算法的研究与分析[D];国防科学技术大学;2008年
3 钱华明;故障诊断与容错技术及其在组合导航系统中的应用研究[D];哈尔滨工程大学;2004年
4 杨金民;低开销的回卷恢复容错技术研究[D];湖南大学;2005年
5 祁超;基于网格的高性能计算平台关键技术及其在CAE中的应用研究[D];西安理工大学;2008年
6 陈阿莲;新型多电平逆变器组合拓扑结构和多电平逆变器的容错技术[D];浙江大学;2005年
7 陈楸;惯性导航系统中非线性问题的数值方法[D];西北工业大学;2004年
8 柳林;面向3G的H.264/AVC压缩视频通信技术研究[D];浙江大学;2006年
9 黄海林;高可靠处理器体系结构研究[D];中国科学院研究生院(计算技术研究所);2006年
10 卢鸿谦;SINS/GPS组合导航性能增强技术研究[D];哈尔滨工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 黄德君;机会网络中容错传输机制的研究[D];湖南大学;2010年
2 杨琳峰;容错加固计算机的设计与实现[D];天津大学;2003年
3 肖毅;网络考试系统安全及容错处理的研究与实现[D];中南大学;2009年
4 齐志华;车站信号电子执表系统研究[D];北京交通大学;2006年
5 杨林芳;无人机容错飞行控制系统研究[D];南京航空航天大学;2007年
6 周晴岚;基于多Agent的实时数据库故障排除技术[D];华中科技大学;2007年
7 焦亮;基于Linux内核的进程检查点技术研究[D];哈尔滨工程大学;2009年
8 严传龙;组合导航系统可靠性分析与研究[D];哈尔滨工程大学;2008年
9 张华健;基于集群系统状态的检查点技术的研究[D];哈尔滨工程大学;2008年
10 蔡常群;基于DSP的变压器保护监控系统的研究与设计[D];湖南大学;2004年
中国重要报纸全文数据库 前10条
1 郑杏果;高性能计算应穿越三重门[N];中国计算机报;2005年
2 汪伟 李玉峰;全国高性能计算中心在津成立[N];天津日报;2004年
3 雍忠玮;协助Linux进军高性能计算[N];计算机世界;2003年
4 本报记者 汤铭;吉林大学建立省级高性能计算中心[N];计算机世界;2010年
5 记者 齐芳;“十一五”期间高性能计算获重要进展[N];光明日报;2010年
6 本报记者 李佳师;高性能计算匮乏“软实力”[N];中国电子报;2010年
7 本报记者 方正;以应用为牵引推动高性能计算发展[N];网络世界;2010年
8 本报记者 方正;推动高性能计算在中国的应用普及[N];网络世界;2010年
9 本报记者 李佳师;高性能计算:重在提高“软实力”[N];中国电子报;2011年
10 中科院深圳先进技术研究院 冯圣中;高性能计算平台要贴近应用[N];计算机世界;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978