持续数据保护(CDP)技术的发展综述

上传人:gg****m 文档编号:204047619 上传时间:2021-10-24 格式:DOC 页数:10 大小:81.50KB
返回 下载 相关 举报
持续数据保护(CDP)技术的发展综述_第1页
第1页 / 共10页
持续数据保护(CDP)技术的发展综述_第2页
第2页 / 共10页
持续数据保护(CDP)技术的发展综述_第3页
第3页 / 共10页
持续数据保护(CDP)技术的发展综述_第4页
第4页 / 共10页
持续数据保护(CDP)技术的发展综述_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《持续数据保护(CDP)技术的发展综述》由会员分享,可在线阅读,更多相关《持续数据保护(CDP)技术的发展综述(10页珍藏版)》请在金锄头文库上搜索。

1、持续数据保护(CDP)技术的发展综述王树云晓春郭莉摘要:随着数据信息垂要性的不断提高,传统数据保护技术的恢复时间H标(RTO)和恢复点H标(RPO) 无法满足数据保护的需求,因此产生了持续数据保护技术。木文对持续数据保护技术的特点、应用场景、 发展现状进行了总结,并对未來的发展进行了分析。关键词:持续数据保护:准CDP:真CDP1引言随着信息化水平的不断提高,数据信息逐渐成为企业赖以生存的基础,数据丢失所造 成的损失也口益严重,9.11事件所造成的灾难性的后果使人们更加深刻地认识到数据信息的 价值和意义。为了保护重要的数据信息,人们一育采用数据复制、备份、恢复等数据保护技 术7】,定时地进行数

2、据备份和复制,这成为了很多企业应付数据丢失的法宝。但是这种在 “固定时间间隔”进行数据备份的方式有很大缺陷:当数据真地需要恢复的时候,两个“固 定时间中间的数据肯定会丢失。随着数据量的增大,尤其是数据量增长速度的加快,使得 单位时间内增加的数据量有可能非常大。在这种情况下,传统的备份方法的恢复点目标】和 恢复时间目标2阴就显得太长,对于一些关键的信息系统是无法接受的。这类信息系统一般 要求7x24小时的运行,短时的停机或者少量数据的丢失都会导致巨大的损失。最近的研究 调查发现在很多行业中,数据丢失或者不可用造成的损失往往达到每个小时上百力美元。 因此,就需要将数据备份的中I定时间间隔”尽可能地

3、缩小,甚至缩为零,持续数据保护(CDP, Continuous Data Protection)就是为了满足这样的需求而出现的数据保护技术。全球网络存储匚业协会(SNIA, Storage Networking Industry Association)数据保护论坛 (DMF, Data Management Forum)的持续数据保护特别兴趣小组(CDP SIG, CDP Special Interest Group)对持续数据保护的定义是:持续数据保护是一套方法,它可以捕获或跟踪数 据的变化,并将其在生产数据Z外独立存放,以确保数据可以恢复到过去的任意时间点。持 续数据保护系统可以基于块、

4、文件或应用实现,可以为恢复对彖提供足够细的恢复粒度,实 现几乎无限多的恢复时间点。持续数据保护技术的关键词是持续,其主要功能是实现故障瞬间完成对任何时间点数据 的快速恢复,保证业务的连续性。因此,能够从根木上解决传统备份中恢复能力低和非精确 时间策略(如按照天的备份)的先天弱点。就给定的数据集而言,持续数据保护提供连续的 恢复点,能够存取任何时问点上的数据,允许应用恢复到任意的时间点Z前,而不仅仅针对 那些由备份流稈预先确定的特殊时刻,H恢复点在时间发生后选定并动态重建。因此持续数 据保护能够提供无限密集的恢复点,有些情况下可以提供接近即时的恢复。1 RPO(Recove Point Obje

5、ctive),把数据恢复到过去的H标时间点,即备份冋溯时间窗I I的“前端点”。PRO 直接影响发生意外灾难击件时可能丢失的数据最。2 RTO (Recovery Time Objective)灾难发生丿匚,从IT系统停机导致业务停顿开始,到IT系统恢复川以支 持业务恢复运营之时,所需要的时间。2数据备份保护技术的比较2.1传统的备份技术数据备份和恢复一肓采用阶段性的备份丽和快照刃来实现。由于数据备份过程会降低应 用的性能并口非常耗时,数据备份一般会安排在夜间进行。在备份过稈中,数据会被备份到 磁带、虚拟磁带或者磁盘。为了节省存储空间,一般会采用每个月或者毎周做一次全量 备份,而每天只做一次增

6、量备份。快照技术能够实现数据的即时影像(pointintime image),快照影像可以支持在线备份。 全最快照是实现所有数据的一个完整的只读副木;为了降低快照所占用的存储空间,人们提 出了写时拷贝(COW , Copy-On-Write)和ROW (Redirect on Write,写时重定向)快照技 术,写时拷贝快照中只保存建立快照示被新的写操作覆盖的数据,而ROW快照只包括新 的写操作数据。快照技术对于应用性能的影响较小必2,每天可以建立多个快照旧。快照可 以在磁盘阵列、文件系统心4、卷管理器25,26、NAS系统272&29或者备份软件中实现。在过去的20年中,虽然计算机技术获得了

7、巨大的发展,但是数据备份技术却是和20 年Z前没有太大变化。数据备份操作代价和成本仍然比较高,并且会消耗大量的时间和资源。 数据备份的恢复时间目标和恢复点目标都比较长。这类备份恢复技术被称为指定时间点(Assigned Pointintime)备份技术。2.2文件版本技术除了阶段性的数据备份之外,文件系统层次实现的多版木文件也是实现数据备份的重要 技术,该技术通过记录文件变化历史来实现对文件的保护。早期的多版木文件系统有Cedarl20 3DFS301和CVS列等,这类文件系统需要用户手动 创建文件历史版木;写时拷贝多版木文件系统有Tops20辺、VMS】等,这类文件系统能够 白动建立文件操作

8、的历史版本;Elephant系统在对一个打开的文件进行第一次写操作时创建 一个版本约;CVFS使用高效的数据结构来记录每个写操作或者元数据的版本信息卩 OceanStore不但将版木技术用于数据恢复还用于简化复制和缓存中的一些问题卩3; LBFS文 件系统通过找到文件与其版木中的相似部分来节省对网络带宽的占用均;皮特森(乙 Peterson)和伯恩斯(R. C. Bums)实现了开源的文件系统cxt3cow,系统提供了快照功能和 文件版木功能;rsyncx rdifT和diff等系统也提供了文件版木功能;为了提高文件版木的有 效性、灵活性和可移植性,穆尼斯沃密瑞迪(Muniswamy-Redd

9、y)等人实现了被称为Versionfs 的轻量级版本文件系统殉,该系统能够支持用户配置的备种存储策略。文件版木技术允许系统恢复到以前的状态,具有可控的恢复时间日标和恢复点日标,但 是都依赖于具体的文件系统,无法直接应川到使用不同文件系统或者数据库的企业数据中 心。和传统的数据备份相比,文件版木主要在文件层次实现,无法在块设备层次实现数据保 护。2.3数据块的持续数据保护技术块设备层次的数据备份和任意时间点数据恢复需要将更改过的所有块数据按时间顺序 保存下来1537581 o 45次写操作部会生成带有时间戳的数据块版木。因为写操作部被记录保存 下来,因此能够动态地访问任意一个时问点的数据状态,可

10、以有效拉近恢复点目标。数据块 级的持续数据保护技术的优点是与应用的藕合比较松,性能和效率比较高(特别是对于育接 访问块设备的应用,例如数据库等更加明显)。缺点是对存储空问的要求比较高,这也是限 制数据块级持续数据保护技术广泛应用的根本原因。3持续数据保护的技术特点持续数据保护技术是对传统数据保护技术的一个重大突破,和传统的数据保护技术相 比,持续数据保护具有以下几个关键的技术特征:1)连续备份、持续捕捉数据变化;2)瞬间和即时的恢复,大大优化恢复的进稈;3)多点的快照技术,历史数据瞬间可用;4)可以实现系统不间断连续运行的目标。传统的数据保护解决方案专注于数据的周期性备份,因此无法避免存在备份

11、窗口、难以 确保数据一致性以及会影响生产系统等问题。备份技术实现的数据保护间隔一般为24小 时小,因此用户会面临丢失多达24小时所产生的数据的风险,采用快照技术29】,可以将数 据的风险丢失量降低到儿个小时Z内,而持续数据保护是一种精细化多点跟踪技术,会不断 监测关键数据的变化,捕获和保护数据中所有的变化,而非仅仅是某个预先选定的时间点, 能将数据风险丢失最降低到几杪。实际上,在传统数据保护技术中采用的是对“单时间点 (SPIT, Single Point-In-Time) ”的数据拷贝进行管理的模式,而持续数据保护可以实现对“任 意时间点(APIT, Any Point-In-Time) ”

12、的数据访问。这样就可以随时访问数据,减少数据 损失并消除代价高昂的停机损失。持续数据保护不断地H动实现数据的保护,使我们无须关 注数据的备份过稈,当灾难发生后,我们仅简单地选择需要恢复到的数据备份时间点,即可 实现数据的快速恢复。复制技术可以通过与生产数据的同步来获得数据的故新状态,但无法防止由人为的逻辑 错误或病毒攻击所造成的数据丢失。当生产数据市于以上原因遭到破坏时(例如数据被误删 除),复制技术会将遭到破坏的数据状态同步到示备数据存储系统,使示备数据也受到破坏。 持续数据保护系统可以使数据状态恢复到数据遭到破坏之前的任意一个时间点,也就可以消 除上述风险。持续数据保护技术侧重点不仅仅是在

13、于备份,更重要的一点是瞬间恢复。持续数据保护 的无缝恢复技术能够实现一泄业务连续性指标,这是传统的备份技术所不具备的。持续数据 保护技术能够确定恢复点目标指标,可以按照用户的要求,恢复到指定的时间点,能够为用 户提供不同类型的数据保护机制和系统保护机制。传统的备份策略都是维护个完全的数据拷贝,而持续数据保护则跟踪那些变化的数据 通常对应到一些读/写事件。通过记录磁盘中的数据变化,存储管理员可以将服务器或 者存储阵列(或者其它受持续数据保护的存储系统)恢复到前面的一个正常点;从前几秒到前 几天都可以技术工人可以非常容易地平衡粒度来从一些可能由网络或者服务器错误引起的 数据错误,比如丢失文件、病毒

14、破坏或者数据损失中恢复数据。虽然持续数据保护可以支持各种粒度的重建,但是它并不保护一个错误从产生到被发现 中间所发生的变化以及事务。比如,持续数据保护不能够阻1卜一个病毒感染一个文件,但是 它可以将感染的文件恢复到Z前的点上问题就是重建点之后的所有T作都会丢失了。依 赖于错误以及对数据的影响,一些数据的重建也许是必要的。从某种穆度上说,持续数据保 护和快照(snapshot)技术非常相似,但是两种方法又有所不同,不同点在于快照是以事件来对待,也许每天一次或者每天两次,或者每小时一次。当一个错误发生时,在快照和错误发 生时刻中间产生的数据就会丢失了,这一点很像传统的数据备份;相比而言,持续数据保

15、护 是一个持续的过程,记录了实时的所有活动,并且可以冋到Z前的错误发生点上。快照通常 可以看作是持续数据保护的一个“幻灯片(slice) ”。4持续数据保护的实现模式、相关问题和应用场景4.1从数据变化的记录角度分类持续数据保护实现的关键技术是对数据变化的记录和保存,以便实现任意时间点的快速 恢复。一般來讲,从该角度可以将持续数据保护实现模式分为以下三类:1. 基准参考数据模式,执行过程为:1)建立供恢复时参考用的数据拷贝(仅一次);2 )在参考的数据拷贝基础上开始顺序向前记录数据羌异事件LI志;3)需要恢复时,在参考的数据拷贝基础上,依据数据养异口志进行数据恢复。2. 复制参考数据模式,执行

16、过程为:1 )供恢复用的参考数据实时与生产数据同步;2)同步的同时,在当前数据的基础上记录数据的冋退事件;3)需要恢复时,在当前数据的基础上,依据数据冋退差异记录口志将数据冋退到 过去的任意时间点。3.合成参考数据模式,执行过稈为:1)建立初始参考数据拷贝;2 )在供参考的数据拷贝基础上开始循序向前记录数据差异事件口志;3)定期将初始参考数据拷贝向前移动(rh上次的参考数据拷贝和记录LI志合成);4)如果必要,重新解析合成参考数据拷贝时间点之前的记录(由向前变为向后)。基准参考数据模式原理简单,实现起来比较容易,但由于数据恢复时需要从最原始的参 考数据开始,逐步进行数据恢复,因此恢复时间比较长,尤其是恢复时间点越靠近当前的时 问,恢复所需要的时问就越长。复制参

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号