收藏本站
《华中科技大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

容灾存储系统故障检测技术研究

杨光  
【摘要】: 随着存储系统与网络技术的不断发展,存储系统在存储容量、性能、可扩展性等方面己取得了飞速的发展,但不可预计的故障、甚至是不可抗拒的故障现象也越来越多,因此提高存储系统的可靠性,保证业务的正常运行己经势在必行。而容灾存储系统也存在一些局限性,比如容灾主要是针对数据备份而言,确保应用不因为意外事件而带来重大损失,但不能保证应用不因为故障的发生而被中断;不能快速反映系统视图的变化。 针对容灾存储系统的局限性,在研究故障检测技术的基础上,结合层次式设计,提出基于容灾存储系统的故障检测系统。故障检测系统是实现系统容灾的基础,他能保证当节点故障时应用会继续运行,并能使各节点间通组间通讯过快速生成统一视图。 快速、高效、准确的故障检测是能否实现有效容灾的前提和保障。当前,故障检测仍存在一些需求尚未解决,如信息丢失、可扩展性、灵活性和动态性等。因此,有必要寻找一种能有效解决上述需求的故障检测方法。为了建立故障检测系统,在故障检测模型、故障检测系统的性能评价指标、故障检测系统构架和故障检测器等方面作了以下几方面的研究: 1.随着容灾存储系统规模的不断扩大,故障检测服务也在向大规模的方向发展。针对大规模故障检测所遇到的问题,分析了大规模故障检测服务应该满足的特性和新的要求;研究了现有的实现大规模故障检测服务的方法;针对故障检测器需要解决的基本问题,对现有的实现方式进行了研究,并比较不同方法之间的差异及各种故障检测协议的优缺点。 2.设计了一种基于容灾存储系统故障检测机制,有效缓解了负载对故障检测的影响,实现了快速、灵活的故障检测。当节点的加入、退出和崩溃时各控制节点可以通过组间通知方式生成一个统一的全局视图。 3.设计了一种自适应故障检测算法——dAFD。dAFD通过估计预期到达时间来提供一个检测时间,动态地估算心跳消息超时时限,以适应系统状态的变化,减少故障检测服务的错误,并按照给出的QoS参数分析其性能。 4.设计了一种权故障检测算法WFDA。WFDA输出一个权值,假如被检测的节点崩溃了,这个权值会随着时间的流逝而单调增长。如果这个被检测节点又恢复可用了,这个权值又要被初始化,应用程序会询问故障检测模块以获得相应节点的权值。每个应用程序都有自己的阈值,这些阈值反映了每个应用程序的需求。当应用程序的阈值大于权值时,故障检测器会认为被检测节点失效,反之则认为节点可用。这种故障检测算法的优点是能按照网络状态和应用程序的需要自动调整。 5.对权故障检测算法进行了改进,将其称为QWFD故障检测算法,它能解决权故障检测算法需要消息行为符合正态分布的假设,以及权故障检测算法不能对服务质量做出定量的需求,应用范围也更加广泛。在权故障检测算法的实现中,应用程序设定的可信度阈值只能定性地刻画其QoS要求,但在实际应用中,大多数分布式应用程序都存在一些较为严格的时间上的约束,故更加需要故障检测器可以按照QoS评价指标支持准确的定量的QoS需求。权故障检测算法的实现,往往需要假设消息行为符合正态分布。但在复杂的大规模存储系统中,存在复杂的异步性、较长的传输延时、较高的消息丢失率,而且其基础结构是动态可配置的,大量的组件及其分布也是动态的,在这样的环境下,消息行为不可能一直符合某种特定的分布特性。因此,作为一个通用组件来设计的故障检测器不应对此作出任何假设。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP274.4

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 张水平;李有峰;童样;张凤琴;;云数据中心心跳检测与故障评估[J];计算机工程与设计;2014年10期
中国硕士学位论文全文数据库 前2条
1 曾尚武;面向容灾的业务连续性保护关键技术研究[D];解放军信息工程大学;2010年
2 张同湖;分布式系统数据容灾技术研究[D];长春理工大学;2012年
【参考文献】
中国期刊全文数据库 前5条
1 刘钢;周敬利;秦磊华;陈小平;;纠错码拜占庭容错Quorum中错误检测机制[J];计算机科学;2007年05期
2 秦磊华;余胜生;周敬利;张宗平;;基于Fibre Chanel组播的远程数据备份体系结构[J];计算机科学;2008年01期
3 余胜生;季文彬;周敬利;曾东;;一种iSCSI存储管理系统的研究与实现[J];计算机工程;2007年23期
4 曾东,周敬利,余胜生,朱建峰;iSCSI Target的设计与实现[J];小型微型计算机系统;2005年04期
5 杨向东;数据存储——金融电子化的基石[J];中国金融电脑;2002年03期
【共引文献】
中国期刊全文数据库 前10条
1 杨龙频;李寅;方丽涌;;医疗行业存储体系架构研究[J];重庆邮电学院学报(自然科学版);2006年02期
2 臧景峰,王凌云,杨波;基于光纤通道的SAN网络技术研究[J];长春理工大学学报;2004年04期
3 刘彦军;;基于“天地图·陕西”架构研究与设计[J];测绘技术装备;2011年04期
4 王占宏,刘彦军,杜道生;SAN技术在基础地理信息数据库系统建设中的应用[J];测绘信息与工程;2004年04期
5 康琼;;存储虚拟化技术探讨[J];长江大学学报(自然科学版)理工卷;2010年03期
6 李淑英,王祥,廖鸿龙,刘传政,张卫华;磁盘阵列技术在测井数据存储中的应用[J];测井技术;2003年05期
7 阳斌;浅论运用SAN技术构建高校校园网[J];长沙大学学报;2005年02期
8 吕远方,朱成彪;SDD和SAN技术对比研究[J];东莞理工学院学报;2005年01期
9 胡宇驰;应用马尔科夫状态图法进行可靠性评估[J];电子科技大学学报;2001年02期
10 刘成印,王雪琪,葛天孝;STD 智能远程通信控制计算机的研究[J];电力系统自动化;1997年12期
中国博士学位论文全文数据库 前10条
1 吴治海;网络环境下的多智能体系统一致性问题研究[D];华中科技大学;2011年
2 贾佳;异构并行计算机容错技术研究[D];国防科学技术大学;2011年
3 刘峰;仪用主从耦合分布式并行处理容错系统体系结构研究[D];浙江大学;2003年
4 张艳;信息系统灾难备份和恢复技术的研究及实现[D];四川大学;2006年
5 刘云生;大规模分布式仿真系统容错关键技术研究[D];国防科学技术大学;2006年
6 李怀阳;进化存储系统数据组织模式研究[D];华中科技大学;2006年
7 赵振;一种自适应海量存储系统组织策略及关键技术研究[D];华中科技大学;2006年
8 庞永刚;基于事件注入技术的网络可信性评测研究[D];哈尔滨工程大学;2007年
9 董剑;分布式系统故障检测的关键技术研究[D];哈尔滨工业大学;2007年
10 王垚;域名系统安全性研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘廷宝;HLA基于历史信息排序的数据分发机制研究[D];哈尔滨工程大学;2010年
2 胡景龙;基于分簇的Ad Hoc网络结点故障检测技术研究[D];哈尔滨工程大学;2010年
3 司继渊;一种基于FPGA的可演化CPU的设计与实现[D];北京交通大学;2010年
4 郭志良;基于时间自动机模型的CBTC系统安全计算机平台的形式化验证[D];北京交通大学;2010年
5 刘志丹;全IP架构复合移动通信系统的容错机制设计[D];解放军信息工程大学;2009年
6 邝景胜;分布式企业服务总线可靠性机制的研究与实现[D];浙江大学;2011年
7 曾磊;工业无线网络中冗余机制的QoS研究[D];西南大学;2011年
8 蔡洪;智能网络存储系统(INSS)中负载均衡技术的研究[D];华南理工大学;2011年
9 刘浩;基于负载均衡的存储架构研究与应用[D];山东大学;2011年
10 孙川;可重构阵列自测试与容错技术研究[D];南京航空航天大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 云晓春,余翔湛;基于确认度失效检测算法的研究与设计[J];北京邮电大学学报;2005年03期
2 杨义先;姚文斌;陈钊;;信息系统灾备技术综论[J];北京邮电大学学报;2010年02期
3 邹见效;张正迁;徐红兵;;三重化冗余多机系统心跳检测机制研究[J];电子科技大学学报;2010年03期
4 张谞;谢亚光;;信息系统的业务连续性研究[J];信息化研究;2009年01期
5 丁泽柳;郭得科;申建伟;罗爱民;罗雪山;;面向云计算的数据中心网络拓扑研究[J];国防科技大学学报;2011年06期
6 刘琼;艾云平;王卓柱;段万寿;;多层次灰色聚类决策对目标价值排序的应用[J];火力与指挥控制;2008年05期
7 谢斌,高扬;Linux高可用集群心跳机制研究[J];计算机工程与应用;2004年01期
8 王树鹏,云晓春,余翔湛,胡铭曾;容灾的理论与关键技术分析[J];计算机工程与应用;2004年28期
9 李玉琳;高志刚;韩延玲;;模糊综合评价中权值确定和合成算子选择[J];计算机工程与应用;2006年23期
10 余翔湛;云晓春;;失效检测性能和评价方法的研究[J];计算机工程与应用;2007年19期
中国博士学位论文全文数据库 前2条
1 张艳;信息系统灾难备份和恢复技术的研究及实现[D];四川大学;2006年
2 董剑;分布式系统故障检测的关键技术研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前6条
1 李大夜;基于linux的集群和心跳设计[D];哈尔滨工业大学;2006年
2 刘维嘉;IP网络故障监测系统的研究与实现[D];西南交通大学;2006年
3 陈诚;面向容灾的失效检测技术研究与实现[D];国防科学技术大学;2008年
4 魏冰璐;一种持续数据保护系统的设计与实现[D];复旦大学;2008年
5 朱永兰;灰色系统在地表水水质评价及预测中的应用研究[D];天津大学;2008年
6 康潇文;基于虚拟存储的容灾数据备份关键技术研究[D];解放军信息工程大学;2009年
【二级引证文献】
中国硕士学位论文全文数据库 前3条
1 曲智辉;数据库同步技术在灾备系统中的应用研究[D];兰州大学;2011年
2 刘杰;分布式SIP会议系统媒体路由策略研究与设计[D];中国舰船研究院;2013年
3 苑超勇;企业业务连续性管理体系构建及应用[D];山东大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 刘崇春,裘正定;小波包尺度图在故障检测中的应用[J];暨南大学学报(自然科学与医学版);2000年03期
2 刘春生;汪芳;柳志荣;;在线故障检测技术在电磁调速系统中的应用[J];模式识别与人工智能;2002年03期
3 李福明,段广仁;一种鲁棒故障检测与分离的参数化方法[J];控制工程;2005年04期
4 胡智;潘成胜;刘勇;;一种基于以太网监控的双独立互联系统故障检测算法[J];沈阳理工大学学报;2006年05期
5 胡绍林;Meinke Karl;陈如山;Huajiang Ouyang;;比对分析与故障检测技术及其在航天工程中应用[J];空军工程大学学报(自然科学版);2007年04期
6 胡奕明;吴德伟;肖汉;;特征分析的串行通信故障检测[J];火力与指挥控制;2008年07期
7 王曰英;周平方;陈丽;段登平;;马尔可夫跳跃系统的鲁棒故障检测[J];电力自动化设备;2010年05期
8 张正道;张卫华;;基于SαS分布参数估计的系统鲁棒故障检测[J];计算机工程与应用;2010年19期
9 王宇红;刘华怡;张娜娜;;基于混合逻辑动态的过程控制实验装置故障检测[J];上海电机学院学报;2011年05期
10 张永;王朝辉;刘振兴;;随机传输的量化网络化系统故障检测[J];华中科技大学学报(自然科学版);2013年03期
中国重要会议论文全文数据库 前10条
1 张汉国;;大系统的故障检测——随机情形[A];1993中国控制与决策学术年会论文集[C];1993年
2 周东华;;一种工业异步电机的在线故障检测与诊断新方法[A];1994年中国控制会议论文集[C];1994年
3 赵琦;周东华;;闭环系统的小故障检测与分离方法[A];第十九届中国控制会议论文集(二)[C];2000年
4 李福明;段广仁;;一种鲁棒故障检测与分离的参数化方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
5 王洪江;孙保民;田进步;;一种图形化的故障检测和诊断方法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
6 彭涛;桂卫华;Ding Steven X;汤琼;李昊;;一种基于混合H_-/H_∞的故障检测系统优化设计方法[A];第二十七届中国控制会议论文集[C];2008年
7 魏晨;陈宗基;;非线性系统的鲁棒故障检测与诊断[A];第十九届中国控制会议论文集(二)[C];2000年
8 韩兵;陈新海;;随机参数最小均方滤波及其在飞行器故障检测中的应用[A];1995中国控制与决策学术年会论文集[C];1995年
9 葛彤;邓建华;;复杂动态系统故障检测与诊断的层次递进方法[A];1996中国控制与决策学术年会论文集[C];1996年
10 方华京;;控制系统故障检测的l~1优化方法[A];第十九届中国控制会议论文集(二)[C];2000年
中国重要报纸全文数据库 前6条
1 陈代寿;BFD高速路由故障检测[N];中国计算机报;2005年
2 涵薏;排除风电系统中的故障[N];上海科技报;2010年
3 上海 徐亚东;ADSL故障检测利器[N];电脑报;2004年
4 暴青雨 本报特约通讯员 赵彦斌;为了战时能打赢[N];解放军报;2011年
5 翟卫平;梁来润;为了航天员的生命安全[N];中国航天报;2003年
6 记者 蔡韬;哈市节日消费投诉不离“老三样”[N];黑龙江日报;2011年
中国博士学位论文全文数据库 前10条
1 王红茹;动态系统的鲁棒故障检测与分离方法研究[D];哈尔滨工业大学;2006年
2 杨青;集合型故障检测与诊断技术研究[D];长春理工大学;2013年
3 张登峰;动态系统的故障检测与诊断研究[D];南京理工大学;2003年
4 马传峰;基于观测器的鲁棒H_∞故障检测问题研究[D];山东大学;2007年
5 赵海军;新一代互联网服务及故障检测若干关键技术的研究[D];北京邮电大学;2009年
6 朱张青;动态系统的鲁棒故障检测与诊断技术[D];南京理工大学;2005年
7 李岳炀;基于观测器的离散时变系统鲁棒故障检测问题研究[D];山东大学;2011年
8 祝志博;融合聚类分析的故障检测和分类研究[D];浙江大学;2012年
9 张永;非线性随机网络化系统稳定性分析与故障检测[D];华中科技大学;2010年
10 李祥宝;基于广义非负矩阵投影算法的故障检测与诊断研究[D];上海交通大学;2014年
中国硕士学位论文全文数据库 前10条
1 孟程程;基于多元统计分析的故障检测与应用研究[D];中国计量学院;2013年
2 李亮;云环境下故障检测研究[D];中南大学;2012年
3 李畅;工业过程故障检测的方法及应用研究[D];东北大学;2011年
4 朱嵘嘉;基于模型的故障检测及容错控制方法研究[D];江南大学;2006年
5 杜运成;基于等价空间方法的采样系统故障检测[D];东华大学;2008年
6 祝翔宇;低成本数字集成电路在线故障检测的研究[D];上海交通大学;2008年
7 夏琳琳;故障检测与诊断技术在组合导航系统中的应用研究[D];哈尔滨工程大学;2006年
8 李仿华;基于神经网络的实时故障检测研究[D];安徽大学;2012年
9 买强;青霉素发酵过程故障检测与故障诊断的研究[D];河北工业大学;2000年
10 曹松银;基于解析模型的故障检测和诊断[D];扬州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026