数据备份 目前存储管理中最重要的操作
对于许多企业的IT网管来说,数据的备份/恢复仍是目前存储管理中最令人头疼的操作。每天,接近三分之二的时间与精力用于应付失败的备份操作和解决磁带及其他媒介的错误。让我们来回顾一下备份/恢复发展的历史,也许会对解决IT管理员们的这一烦恼有所帮助。
上世纪70年代,IT革命处于萌芽阶段。那时的数据量很小,通常只有几十兆到几百兆。当时的硬盘成本更是接近天价,每兆硬盘空间的售价超过了3000美元,购买一个容量小于10兆的硬盘所需的费用,甚至超过了一个系统程序员全年的工资。另一方面,基于硬盘的存储技术却还刚刚起步。基于上述原因,当初进行备份/恢复操作时,往往采用磁带作为备份介质。
基于磁带的“备份/恢复”面临的问题
进入21世纪的海量数据时代,与30年前相比,数据量已经从几十、几百兆增长至几千TB;而且由于数据备份和恢复操作几乎是贯穿全年的例行工作(Routine Job),如果现在仍然以磁带作为最基本的备份介质,不仅会耗费管理员大量的时间和精力,同时也会产生诸多问题。主要表现在以下几方面:
工作量巨大
数据备份和恢复操作贯穿全年365天
备份/恢复的工作量占整个存储管理的60%-70%
数据很难有效恢复
由于备份窗口或介质失效等原因,备份作业的成功率只有70%左右
恢复时间太长,从磁带中恢复单个文件往往要花费几个小时甚至1天
本质上是一项“体力活”
磁带库内磁带的循环更新,将磁带拿进取出,不可避免仍需要大量人工干预
进行离场保护时,大量磁带在数据中心和异地之间的来回运输,需要耗费大量的人力
“一体化数据保护”是解决问题的最佳途径
好在时至今日,随着数据量的成倍增长,计算机技术也有了突飞猛进。硬件尤其是硬盘的价格与早期相比有了大幅下降,不断刷新的硬盘容量也令人惊喜。基于磁盘的存储新技术(如快照、镜象等)日益涌现。调查显示,目前超过80%的恢复请求是在数据丢失后48小时内提出的,这意味着恢复速度更快的基于磁盘的存储技术开始成为主流。而由于磁带在某些方面仍具有不可取代的优势,如价格低廉、适合数据的长久保留等,因此采用以磁盘和磁带技术相结合的所谓“一体化数据保护”方案,成为很多企业在进行数据保护时的最佳做法。实施步骤见下图:
下面,我们对上图中的每一模块进行详细解释。
本地镜象(快速恢复卷):
在某一时间点,对生产数据进行同步,然后断开,以保留生产数据在该时间点的静止状态
用于对保留期内整个数据的快速恢复
一天可做一次或若干次本地快速恢复卷,保留24小时
磁盘消耗量高(100%)
对应用影响较大
数据快照:
采用Copy-on-Write的方法保留与前一基准点相比已变化的数据
基准点数据出现问题就无法使用
用于保留期内对少量数据的快速恢复
使用频率较高, 例如:每2小时快照一次,常保留24—48小时
磁盘消耗量较低(5%-20%)
对应用影响较小
异地镜象:
对生产数据的100%异地镜像
对由于逻辑错误而丢失的数据没有保护作用
常用于对生产站点的容灾保护
采用连续复制以保持与生产数据一致
同步复制方式
异步复制方式
近线存储:
用于对生产数据进行备份
常采用廉价的ATA/SATA磁盘阵列作为备份设备,以提高速度和可靠性
通常数据保留时间为1周-1个月,然后,被迁至磁带库作更长时间的保留或归档
磁带库:
磁带是数据长久保留/归档的最佳选择
磁带上的数据往往被视为数据保护的最后防线
由于磁带可以在物理上与生产系统脱离,磁带可以用于数据离场保护
磁带存储成本仍然是最低的
某世界著名的大型石油公司的“一体化数据保护”做法就很值得借鉴:每天上午8点,对重要的SAP数据做一次“克隆”,产生本地镜象;之后每隔4小时对数据变化量进行快照,每个快照保留48小时。每天晚上12点,将快照中的数据备份到近线存储设备,保留两周。两周后,将数据拷贝到磁带库中保留一年。磁带库中的数据同时复制有多个副本,其中一个数据副本作离场保护,妥善保管到异地的仓库或办公室。与此同时,这些数据也采用复制的方式产生异地镜象,以实现容灾保护。 #p#page_title#e#
可想而知,在上述“一体化数据保护”措施的周密保全下,该公司面对各种情况下的数据丢失都能从容应对:若需要恢复48小时内丢失的数据,可从本地镜象和快照中恢复;若需恢复两周内遗失的数据,可从近线存储设备中恢复;而两周以后的数据则可以从磁带库中进行恢复;万一发生了火灾或类似“9.11”之类的大型灾难,也不必惊慌失措,则可以切换到容灾点(异地镜象),也可以从离场保护的磁带副本中恢复所有数据。
CommVault能帮助客户更好地实现“一体化数据保护”
上面提到的例子生动地展示了“一体化数据保护”的显著优势。然而真正实施起来却是非常困难的。原因在于,上面提到的所谓数据复制(异地镜象)、数据克隆、数据快照等技术都依赖于磁盘硬件,所以不同的厂商就会有不同的实现方式,使得用户使用起来非常困难——要求IT管理员必须同时掌握多种管理软件,在不同的操作界面中来回切换,而且需要大量的手工操作(比如编写脚本)来实现多种技术的协同工作,因此不仅大大增加了使用成本,同时也非常容易出错。
美国慷孚系统公司(CommVault Systems Inc.)一直以来致力于研究如何有效地进行数据管理,它的“统一数据管理”平台为真正实现“一体化数据保护”提供了有效的解决方案。通过CommVault的“统一数据管理”平台,在一个单一的图形化管理界面中,用户只需要针对所需要的各种数据副本,包括本地镜象、数据快照、异地镜象、数据备份等制定相应的策略(如存放在什么设备上、保留多久、何时存放等),CommVault的软件会自动地协调相应的硬件设备进行工作,真正实现完美的“一体化数据保护”。