收藏本站
《哈尔滨工程大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

面向恢复的容错计算技术研究

李海山  
【摘要】: 高可靠容错计算机的成本、可实现性和可扩展性问题一直是困扰其开发和广泛使用的主要问题,而利用商用计算机成熟硬软件技术和资源(COTS技术)实现容错计算系统,拥有传统专用容错设计没有的许多优点,成为了容错技术研究热点。但在当前以COTS技术为基础的软件和软硬件协同实现的容错计算系统中,如何实现容错功能的透明性和提高故障检测、诊断、恢复的效率,减少对系统正常工作的影响一直是研究的重点和难点问题;另外,目前使用广泛的基于卷回的故障恢复机制存在一些先天不足,必须加以克服。 基于此,本文在对目前国内外一些容错计算系统的实现原理和集群技术进行深入研究后,提出了利用COTS技术、容错和集群思想,实现容错集群服务器的结构模型,以满足一些领域对服务器高可靠、高可用及高性能的要求。研究并实现了一种基于PC/Linux平台下结合容错技术和集群技术优点的OPIAC容错集群服务器系统,对其故障发生情形进行了分析研究,重点研究了它的故障恢复模型和策略、检查点实现技术,并对系统性能进行了评估。 首先,对几种具有典型代表性的容错计算系统体系结构进行了分析,对当前容错系统设计中使用的故障恢复机制、方法,检查点技术实现原理进行了研究,分析了影响检查点系统开销的关键因素、检查点技术的演化趋势及基于检查点技术实现COTS智能容错计算和故障恢复存在的困难及目前需要解决的一些主要技术问题。 其次,研究了在有备份模块和无备份模块的TMR容错结构中故障发生及故障恢复的各种情形,定量分析、比较了两种容错体系结构下使用的故障恢复算法的效率;根据实时应用系统对实时任务(进程)运行时间的限制,研究了检查点设置间隔(两次进程状态保存之间的时间)对进程正常运行的影响,给出了一种满足实时应用需求的动态保存进程状态的检查点设置策略。为进一步提高故障恢复效率,提出了智能容错系统的透明、并行故障恢复算法—阶梯型算法。 第三,提出了一种基于COTS技术、结合容错技术和集群技术构造高可靠和高性能容错服务器的思想,并据此基于PC/Linux系统平台,设计实现了一个集成了容错机高可靠性、高可用性和集群系统高性能的OPIAC容错集群服务器。通过对Linux内核的改造和扩充,采用具有自主处理能力的容错管理模块完成系统容错功能,实现了容错功能对应用的透明,一方面对在OPIAC容错集群服务器上运行的应用程序的编写和运行没有任何限制和附加要求;另一方面对与服务器通信的客户端应用来说,感觉不到服务器内部的故障检测、诊断和恢复及服务进程在内部节点间的迁移过程,并且不影响新的网络连接的建立。详细描述了实际实现中进行故障恢复时,为了有效减少故障恢复时间,提高容错服务器执行效率采用的多种措施。通过设计虚拟设备驱动层、设备资源管理层和内核服务仿真层,并将其与基于日志的故障恢复算法配合使用,克服了基于检查点的传统卷回恢复技术在I/O恢复方面存在的不足。 最后,详细介绍了在Linux操作系统中如何实现对进程状态的保存和恢复。
【学位授予单位】:哈尔滨工程大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP311.52

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 邵璐;费洪晓;;内存数据库技术在移动实时累加系统中的应用[J];计算机系统应用;2011年08期
2 刘健;张志华;张小庆;郑剑敏;;继电保护与配电自动化配合的配电网故障处理[J];电力系统保护与控制;2011年16期
3 刘健;赵树仁;贠保记;崔琪;何林泰;郑剑敏;;分布智能型馈线自动化系统快速自愈技术及可靠性保障措施[J];电力系统自动化;2011年17期
4 ;下期要目[J];控制与决策;2011年09期
5 ;系统关机变重新启动[J];电脑爱好者;2011年06期
6 ;戴尔EqualLogic PS系列存储设备[J];办公自动化;2011年13期
7 刘光辉;;使用时间冗余保证处理器的可靠性[J];计算机工程与应用;2011年21期
8 王东霞;窦文华;周兴铭;;现代军用网络生存性研究[J];通信技术与发展;1998年04期
9 刘旭;胡未琼;戴伟;;基于智能容错技术的雷达软件可靠性研究[J];现代雷达;2011年08期
10 徐俊波;王慧强;冯光升;吕宏武;田苏梅;;Bellman动态规划的服务恢复方法[J];哈尔滨工程大学学报;2011年06期
中国重要会议论文全文数据库 前10条
1 王宝华;许贵东;;配电网馈线自动化故障恢复系统探讨[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
2 李家豪;;在CICs下运行的SAFFII的故障恢复特性[A];第三次全国计算机安全技术交流会论文集[C];1988年
3 罗宏;宿红毅;战守义;;无线传感器网络故障诊断与容错技术研究进展[A];第八届全国信息获取与处理学术会议论文集[C];2010年
4 张艳梅;曹怀虎;韩文英;;基于服务覆盖网络的服务组合路由问题研究综述[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(下册)[C];2007年
5 张海波;张晓云;张莉;陶文伟;王俏文;;基于广度优先搜索的配电网故障恢复算法[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(中册)[C];2008年
6 李卫玲;李陶深;;网格环境下的故障恢复协议研究[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
7 赵丹;吴纯青;胡晓峰;;MPLS故障恢复机制仿真与分析[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
8 李俊;戴先中;孟正大;窦建平;;基于改进的网重写系统途径的可重构制造单元故障恢复(英文)[A];2009年中国智能自动化会议论文集(第八分册)[控制理论与应用(专刊)][C];2009年
9 曲桦;李增智;;具有多重故障恢复能力的光网络生存性机制[A];2006年全国通信软件学术会议论文集[C];2006年
10 袁亮;宋强;;以太环网路径保护机制的研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
中国重要报纸全文数据库 前10条
1 江西 刘素珍;Windows 95操作系统故障恢复一例[N];中国计算机报;2000年
2 闫冰;Trapeze:让无线永不掉线[N];网络世界;2008年
3 ;用异步镜像技术实现灾难恢复[N];网络世界;2007年
4 西门子通信网络公司 王雷;解析以太网环保护技术[N];计算机世界;2007年
5 颜军;CDP带来存储新气象[N];计算机世界;2006年
6 ;企业无线局域网的演变:从提供便利到取代有线(二)[N];网络世界;2008年
7 长沙 刘胜;键盘原因引起电脑不启动故障[N];电子报;2007年
8 ;如何构筑稳固、经济、高效的信息长城?[N];人民邮电;2008年
9 赵晓涛;浅析重大事件中的“安全融灾”[N];网络世界;2008年
10 陈君;让濒临破产的企业绝处逢生[N];中国水利报;2006年
中国博士学位论文全文数据库 前10条
1 李海山;面向恢复的容错计算技术研究[D];哈尔滨工程大学;2007年
2 卢朝霞;迁移工作流容错执行模型及其实现方法研究[D];山东大学;2009年
3 马骞;电网调度决策支持系统的研究[D];华北电力大学(北京);2005年
4 徐精求;配电网抗灾变性分析及大面积断电快速恢复[D];西安科技大学;2008年
5 周艳玲;MPLS网络下多播技术的研究[D];东华大学;2010年
6 潘淑文;加权复杂网络抗毁性及其故障恢复技术研究[D];北京邮电大学;2011年
7 王新华;基于MPLS网络的约束路由及故障恢复研究[D];山东师范大学;2008年
8 刘军;配电网智能优化规划平台的算法研究与应用[D];华北电力大学(北京);2008年
9 赵太飞;抗毁光网络中预置圈算法研究[D];电子科技大学;2007年
10 吉萌;高性能业务路由器系统软件研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 高阳;地区电网故障恢复操作票系统的研究与开发[D];华北电力大学(北京);2005年
2 梁作娟;分布式数据库系统的故障恢复技术研究[D];中国海洋大学;2003年
3 赵洁琼;地区电网在线故障恢复系统的研究[D];华北电力大学(河北);2010年
4 王伟利;基于启发式多代理演化算法的配电网故障恢复研究[D];燕山大学;2012年
5 黄宗君;基于最小生成树理论的配电网故障恢复算法[D];四川大学;2004年
6 郑朝明;配电网故障恢复系统的研究[D];华北电力(北京)大学;2002年
7 代小翔;基于GIS的配电网网络优化[D];四川大学;2004年
8 明旭;iEAI工作流管理系统中的系统故障恢复方法[D];吉林大学;2005年
9 荣垂田;一个内存数据库模型的设计与实现[D];中国科学院研究生院(沈阳计算技术研究所);2008年
10 臧天磊;配电网静态优化与故障恢复重构策略研究[D];西南交通大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026