基于简化MD5摘要技术快照差分算法的研究
【摘要】:随着计算机技术的飞速发展人类社会信息化程度得到不断推进,数字化的信息量呈现出几何级数增长的趋势。如果能够集成和有效地利用这些信息,将会极大的提高生产效率从而给社会带来极大的收益。
数据集成最基础和最早的阶段是增量检测以得到增量数据,其评判标准主要是看检测的代价及高效性。应这些需求出现了很多相应的增量检测办法如触发器、日志分析等。而因为通用性和简单性能够占有一席之地快照差分算法是简单比较数据源两个时刻的快照来达到检测增量数据。
本文对快照差分算法进行研究,快照差分算法因其通用性及可移植性在各种增量检测方式中占据了一个不可替代的位置。首先以介绍传统Sort Merge快照差分算法为基础,根据其代价主要产生对数据量大的快照文件进行比较时的多次磁盘IO问题。为降低算法的磁盘IO,提出元组摘要的方法降低备份的快照文件大小。经过验证基于摘要的SortMerge算法有效的降低了运算过程中涉及的磁盘IO量,使算法的效率得到了极大的提升。
由于摘要算法的选取对整个算法实施的性能影响至关重要,本文再对摘要算法选取和改进进行了一些探讨。最后选择了被广为使用的MD5摘要算法,通过减少其循环重数的方法对其进行简化并对简化后的算法进行了验证。最后使用简化后的MD5算法形成基于简化MD5的SortMerge算法,相比原始快照差分算法和基于原始MD5的SortMerge效率得到了极大的提升。
|
|
|
|
1 |
沈红雨;;英语学习平台数据库的异地热备份设计与实施[J];电脑知识与技术(学术交流);2006年36期 |
2 |
周敬利,汤文晖,余胜生,杨立辉;附网存储中快照技术的设计[J];计算机工程与应用;2003年27期 |
3 |
王辉;ORACLE数据库的性能调整与优化——以中日合作项目林火监测系统为应用实例[J];林业资源管理;2003年06期 |
4 |
唐土生;;利用Oracle数据库快照实现数据双向复制[J];福建电脑;2006年05期 |
5 |
吴田仙;;快照模式焦平面最高读出速度的研究[J];科技信息(学术版);2006年08期 |
6 |
吴远红;陈爱萍;;共享数据库平台中的时态数据处理研究[J];电脑知识与技术(学术交流);2006年32期 |
7 |
褚福勇;肖侬;蔡志平;陈彬;;虚拟机备份机制研究[J];计算机工程与科学;2009年09期 |
8 |
陈彬;蔡志平;肖侬;褚福勇;;虚拟机管理器中面向虚拟块设备的一种通用快照扩展机制[J];计算机工程与科学;2011年05期 |
9 |
陈中建,李晓勇,吉利久,韩建忠,喻松林;低功耗64×64CMOS快照模式焦平面读出电路新结构[J];半导体学报;2001年11期 |
10 |
尤国君;;基于iSCSI的个性化无盘工作站架设[J];中小企业管理与科技(下旬刊);2011年08期 |
11 |
刘晓鹏;郭桂荣;许浒;;容灾关键技术分析及方案设计[J];科技资讯;2006年25期 |
12 |
宋晓宇;孙业挺;孙焕良;;CYPK-KNN:一种改进的移动对象KNN查询算法[J];沈阳建筑大学学报(自然科学版);2006年06期 |
13 |
刘凯;崔晓燕;;基于Monte Carlo方法的3G网络仿真[J];信息技术;2007年04期 |
14 |
周鹏;杨丹;鱼详训;;带快照的混合数据库系统设计与应用[J];计算机科学;2008年04期 |
15 |
熊安萍;唐巍;蒋溢;;具有快照功能的Linux文件系统[J];计算机应用;2010年S1期 |
16 |
万涛;;信息系统进程监控[J];宝钢技术;2010年06期 |
17 |
李拥军,贺桂英;网络安全策略研究和PGP分析[J];湘潭大学自然科学学报;2002年02期 |
18 |
陈志贤,王绍棣;SIP协议中认证注册机制的研究[J];南京邮电学院学报;2003年03期 |
19 |
李杰,张学旺;MD5报文摘要算法与文件系统完整性保护[J];湘潭大学自然科学学报;2003年03期 |
20 |
邸晓奕,万映辉;ORACLE分布式数据库系统位置透明性的实现机制[J];计算机系统应用;1998年06期 |
|