收藏本站
收藏 | 论文排版

基于网络编码的分布式存储数据安全性研究

徐俭  
【摘要】:分布式存储系统是将数据分散地存储在多个设备,因具有诸如高可靠性、高可用性以及高存取效率等优点,而成为了当今工业界解决大规模数据存储的一种主流方案。但它面临安全性方面的严峻考验,如容易受到窃听攻击、存在数据信息泄露的风险。因此,在分布式存储系统环境下开展数据安全方面的研究己经成为当前热点问题之一。网络编码技术作为提高网络吞吐量、鲁棒性和安全性的有效方法,应用在分布式存储系统(Distributed Storage System,DSS)中,称为再生码(Regenerating Code,RC)技术,用来保护系统对抗窃听的研究已经成为国内外数据安全领域的研究热点之一。实际中不断出现异构DSS应用,并且相比传统模型,广义模型因具有巨大的潜在性能增益、更适合异构场景、更具有实际吸引力而成为最近的研究热点。另外,完美安全性在实际中通常不是必须的,不同的实际应用通常具有不同的安全水平需求。然而,已有同构系统传统模型中完美安全性要求的防窃听技术难以直接扩展到异构的、广义模型以及具有不同安全水平要求的场景。因此,如何针对异构的、广义模型场景设计再生码保护系统对抗窃听并满足不同安全水平等新型的数据存储应用需求是本文研究的关键问题。本论文以保护DSS对抗窃听为目标,以网络编码技术为核心,以理论分析推导系统安全约束条件和确定的、最优的编码实现为途径,着重研究异构系统、广义模型中的数据安全性以及具备不同安全水平的防窃听理论和技术,所研究的窃听问题包括节点窃听和链路窃听等主要窃听模式。具体研究内容和创新点简述如下:(1)研究了基于网络编码的异构DSS中防链路窃听问题。首先,针对具体的修复带宽异构的DSS,在理论上推导了系统具有最高安全水平的约束条件。然后,将经典的同构DSS编码理论—乘积矩阵(Product Matrix,PM)理论—进行推广,提出扩展的乘积矩阵(Extended Product Matrix,EPM)理论。进一步,应用提出的EPM理论,在传统模型下设计了确定的、最优的、最小远程修复带宽再生(Minimum Remote-Repair Bandwidth Regenerating,MRBR)码,满足系统最高安全水平条件。给出了 MRBR码的数据重构和故障修复性质的严格证明。为了演示,提供了 MRBR码实例。提出的MRBR码是传统模型中第一个确定的、最优的、满足系统最高安全水平的异构RC结构。此外,提出的EPM理论也能够用于同构系统编码。(2)研究了广义模型中数据安全性,提供了具备不同安全水平的RC结构以及广义模型中的系统安全容量上界。针对节点窃听问题,对比传统模型,分析了广义模型在数据安全方面的优势,在理论上给出了安全水平度量,基于此,在广义模型中提供了一种确定的、安全水平可以灵活设计的RC结构。进一步,推导了广义模型中系统安全容量上界表达式,通过对比分析,表明了获得的安全容量上界与先前传统模型中不同条件下获得的各类上界的一致性。基于所提供的RC结构,在最小带宽再生(Minimum Bandwidth Regenerating,MBR)点给出了能够获得该安全容量上界,使系统获得完美安全性的编码实例,表明了该上界的紧致性。(3)研究了同时满足最小存储和最小修复带宽的防窃听RC设计。考虑节点窃听问题,提出了一种广义转置矩阵理论,在此基础上,结合分组设计方法,在广义模型中提供了确定的、最优的最小存储和最小带宽再生(Minimum Storage and Minimum Bandwidth Regenerating,MSBR)码,获得了最小的存储和最小的修复带宽。通过简单的改变编码参数,提供的MSBR码结构具有不同的性能参数,包括存储节点个数、重构可选择性、修复可选择性以及码率等。进一步,提供的MSBR码结构能够设计为不同安全水平,通过对比分析编码实例,提供了安全水平和数据重构可选择性之间的权衡关系,这对实际系统的具体设计具有一定的指导价值。提供的MSBR码结构是第一个确定的、最优的、同时满足最小存储和最小带宽、具有不同安全水平的RC结构。(4)研究了安全水平与系统重要性能参数之间的关系。在理论上提出修复自由度作为衡量广义模型相比传统模型对修复约束条件的放宽程度的度量,基于此,考虑节点窃听问题,给出了系统信息流图分析,推导了广义模型中存储和修复带宽之间的tradeoff关系式,并在理论上给出了安全水平与系统参数之间的关系式。对比分析了传统模型中存储-修复带宽tradeoff,表明了广义模型通过增加数据修复自由度能够具有更好的存储-修复带宽tradeoff。此外,通过对比传统模型,在MBR点提供广义模型系统存储容量增益与数据修复自由度的关系,对实际系统设计具有指导作用。数值结果分析了与安全水平和数据修复自由度相关的性能曲线。更进一步,提供了确定的编码实例能够获得该存储-修复带宽tradeoff上的MBR点,实现了消费者指定的安全水平,表明了获得的存储-修复带宽tradeoff的可得性。综上所述,本论文对分布式存储系统数据下基于网络编码的窃听阻止问题进行了较为系统深入的研究。通过运用信息论、图论、最优化、以及矩阵论、线性代数等理论,分别针对异构DSS中的链路窃听问题和广义模型中的节点窃听问题,推导了系统安全约束条件,提供了系统信息流图分析,研究了安全水平与系统重要参数之间的关系,提出了确定的、最优的,具有最高安全水平、不同安全水平、最小存储和最小带宽的编码结构,并给出了相应的对比分析、数值结果分析以及编码实例,在一定程度上解决了 DSS面临的窃听问题。所提出的理论和技术进一步发挥了网络编码在保护DSS对抗窃听方面的潜力,扩展了传统的防窃听理论和技术,扩大了应用场景范围,提高了设计灵活性,增加了实用性。


知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978