光纤硬盘磁盘阵列技术分析
当今世界信息爆炸式的增长,除了给科技与技术的发展带来更大的发展动力外,也给企业的数据存储带来了巨大的挑战。然而,作为企业信息存储系统中的最关键部分——磁盘阵列,很多人未必能说得清楚。
磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。这项技术的核心设计理念是RAID技术。原来的名称是“Redundant Array of Inexpensive Disk”,最初的研制它的目的是为了组合小型的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用。同时也希望通过冗余信息的方式,使得单一磁盘失效时不会丢失数据,因此开发出不同级别的RAID数据保护技术,并在此基础上逐渐致力于提升数据访问速度。这个名字后来改为“Redundant Array of Independent Disk”,但仍然称作“RAID”。
经过多年的发展,企业中数据的价值越来越高,而承载这些数据的磁盘阵列也越发受到用户的重视。从市场分布可以看出,存储与服务器所占比例呈逐年上升趋势。用户的强大需求同时也给存储系统供应商创造了巨大的商机。目前市场上不但有老牌厂商提供的各种产品,也有初创公司新推的各种系统。自然,当前市场上的磁盘阵列也是一番花团锦簇的景象。在用户有了众多选择的同时,也有了选择上的困惑。因此,我们就从体系结构的角度,简要分析目前磁盘阵列的差异性,希望可以给用户在选择磁盘阵列时参考。
目前的磁盘接口有IDE、SATA、SCSI、SAS、FC等几种。其中IDE接口磁盘正在被SATA接口硬盘取代,将逐渐退出历史舞台,两者主要多用于桌面;SAS接口磁盘也正在逐渐淘汰SCSI接口,很快将占领企业应用的低端市场;而FC(Fibre Channel,光纤)接口硬盘一出生就是专门针对高可靠、高可用、高性能的企业存储应用的,不但接口速度快,而且支持双端口访问,又经过严格的生产工艺控制,可靠性很好。由于这些天生优势,FC接口硬盘在企业用户中尤其是关键数据存储应用中占据着绝对优势,也是高端存储应用的首选磁盘。
基于SATA、SCSI接口的磁盘阵列大家见过很多了,这里就不再赘述,重点说是所光纤接口磁盘阵列。光纤磁盘阵列又可进一步从体系结构细分成三大类:JBOD磁盘阵列、双控制器磁盘阵列和多控制器磁盘阵列。
RAID的英文全称为:Redundant Array of Independent Disks。翻译成中文即为独立磁盘冗余阵列,或简称磁盘阵列。由美国加州大学在1987年开发成功。
RAID的初衷主要是为大型服务器提供高端的存储功能和冗余的数据安全。 我们可以这样来理解,RAID是一种把多块独立的硬盘(物理硬盘)按不同方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据冗余的技术。组成磁盘阵列的不同方式成为RAID级别(RAID Levels)。在用户看起来,组成的磁盘组就像是一个硬盘,用户可以对它进行分区,格式化等等。总之,对磁盘阵列的操作与单个硬盘一模一样。不同的是,磁盘阵列的存储性能要比单个硬盘高很多,而且在很多RAID模式中都有较为完备的相互校检/恢复的措施,甚至是直接相互的镜象备份,从而大大提高了RAID系统的容错度,提高了系统的稳定冗余性,这也是Redundant一词的由来。
不过,所有的RAID系统最大的优点则是"热交换"能力:用户可以取出一个存在缺陷的驱动器,并插入一个新的予以更换。对大多数类型的RAID来说,可以利用镜像或奇偶信息来从剩余的驱动器重建数据不必中断服务器或系统,就可以自动重建某个出现故障的磁盘上的数据。这一点,对服务器用户以及其他高要求的用户是至关重要的。
数据冗余的功能指的是:在用户数据一旦发生损坏后,利用冗余信息可以使损坏数据得以恢复,从而保障了用户数据的安全性。
RAID以前一直是SCSI领域独有的产品,因为它当时的技术与成本也限制了其在低端市场的发展。今天,随着RAID技术的不断成熟与厂商的不断努力,我们已经能够享受到相对成本低廉的多的IDE-RAID系统,虽然稳定与可靠性还不能与SCSI-RAID相比,但它相对于单个硬盘的性能优势对广大玩家是一个不小的诱惑。随着相关设备的拥有成本和使用成本不断下降,这项技术也已获得一般电脑用户的青睐。 #p#page_title#e#
严格意义上讲,JBOD还不能称之为“阵列”。JBOD是Just Bundle of Disk的缩写,意即只是一串磁盘的组合。这样的“磁盘阵列”也被称为傻盘阵列,因为JBOD内部既没有控制器,也没有缓存,磁盘之间也没有提高性能和安全性的任何手段。每个磁盘都独立地接收来自主机的数据访问。如果需要实现RAID级别的保护,主机不但要负担磁盘读写等操作,还要进行RAID算法的处理,对主机资源的占用率较大,严重影响系统整体性能。
因此,在采用光纤磁盘阵列时,一般都采用带智能磁盘控制器的磁盘阵列。磁盘控制器是介于主机和磁盘之间的控制单元,配置有专门为I/O进行过优化的处理器以及一定数量的cache。控制器上的CPU和cache共同实现对来自主机系统I/O请求的操作和对磁盘阵列的RAID管理。相对于JBOD磁盘阵列,控制器磁盘阵列释放了大量主机资源,来自主机的I/O请求由控制器接受并处理,阵列上的cache则作为I/O缓冲池,能够大大提高了磁盘阵列的读写响应速度,显著改善磁盘阵列的性能。又由于光纤磁盘天生拥有双端口,所以,一般的光纤盘阵都采用双控制器,从而充分发挥光纤磁盘的高可用特性。两个控制器不管配置成active-active还是active-standby,都能为用户提供高可用特性,而且大都支持热插拔功能,能够实现简单的无单点故障,为用户提供的7*24不间断业务。
在配置了CPU和cache的磁盘阵列中,其部分高端产品还可以运行基于磁盘阵列的存储软件。因此,它可以提供比较全面的基于磁盘阵列的解决方案。
磁盘控制器:管理cache和物理磁盘组之间I/O及运行基于存储的软件解决方案。
在实际应用时,每层的控制器至少成对配置,提供全冗余特性,实现无单点故障。也可以配置多对,在性能上进行成倍扩展。比如EMC的DMX-3最多可以配置8个前端控制器(Channel Director)、8个缓存控制器(Memory Director)、8个后端控制器(Disk Director),整个系统中处理器数量最多可达130颗。多级控制器分工协作,系统整体性能因而可以获得最佳扩展性。更重要的是,在多控制器体系结构基础上,提供了许多独特存储软件解决方案。该档次产品是大型关键业务数据中心的首选。
在当前存储市场上,这一类的磁盘阵列种类繁多,数量巨大,同时也在质量和性能上也存在着巨大的差距,价格跨度也很大。其代表产品有IBM DS系列、HP EVA系列、EMC CLARIION系列、HDS Thunder 95系列等等。LSI也在这一档次的磁盘阵列方面颇有建树。尤其值得一提的是,IBM S-4000系列、STK D系列及SGI TP系列都是OEM LSI公司的E系列阵列控制器。
从体系结构上讲,这类产品属于中端产品,但其中比较引人注目的是IBM SHARK系列产品。IBM的SHARK系列产品是典型双控制器结构的产品,其高端型号DS-8300产品的每个控制器是4个CPU的P570小型机,双控制器最大配置CPU数量为8个CPU。但DS-8000系列产品具备了许多高端产品应有的特征,比如主机端口最大可达128个2Gb FC,磁盘接口多大64个,缓存容量也可以达到256GB,这些特性使其可以匹敌多控制器存储系统,因此,DS-8000系列也是IBM公司参与高档存储产品市场竞争的主要武器,而且和竞争对手高档产品相比其价格优势非常明显。
第三类是多控制器磁盘阵列:双控制器磁盘阵列由于控制器只能配置两个,不能在同一磁盘阵列内配置更多控制器,在一定程度上局限了其数据处理能力。多控制器磁盘阵列便应运而生,其体系结构一般分为三层:
通道控制器:管理主机和cache之间I/O及运行基于存储的软件解决方案。
全局缓存控制器:巨大的非易失性cache,它是系统性能超群的基础之一。
目前,掌握高档多控制器体系结构产品技术的厂家,只有EMC和HDS这两家公司。从体系结构来看,最初的EMC和HDS公司的多控制器磁盘阵列产品没有什么区别,都是基于总线结构。后来HDS开发出了基于全交换架构的Lightning9000/USP系列,并在内部把控制流和数据流分开,提升了内部的传输带宽。其后EMC推出了基于直联矩阵结构的Symmetrix DMX系统,在继承低延迟特性的基础之上,进一步的提升了内部总线的带宽。但无论如何,这类系统都是以高可靠性和高可用性为诉求的高端存储阵列,在这两方面已经达到了近乎完美,在电信和银行等领域都得到了极大的认可和广泛的应用。 #p#page_title#e#
很多服务器生产厂商也都有磁盘阵列产品出售。由于拥有广泛的销售渠道和强大的市场运作能力,也有较高的市场占有率,到目前为止,所有主机厂商掌握自主知识产权的磁盘阵列仍然停留在双控制器磁盘阵列这个层面。虽然HP和SUN也有的多控制器体系结构的磁盘阵列在销售,但都是OEM HDS产品。
RAID并没有限制使用多少个盘,应用时盘越多越好。
对于SCSI结构的RAID来说,盘的最大数量与SCSI通道(SCSI总线)的数量有关,
一般是每个通道最多装15个盘(SCSI/3),
对于FC-AL(光纤)则是每个通道200个盘.
当下流行的信息生命周期管理、虚拟存储、存储资源管理等等理念都和分级存储密切相关,这为用户进行全方位的数据管理提供了参考。用户可以根据信息的价值采取适当级别的磁盘阵列,制定相应的存储方案。