什么是RAID 2.0+? 随着各行业数字化进程的推进,数据逐渐成为企业单位的运营核心,而企业级存储是一个复杂的系统,数量最多且最脆弱的组件就是硬盘。在传统RAID技术环境中,存储系统一般会有多个RAID组,每个RAID组中包含多块硬盘。由于每个RAID组的业务繁忙程度不同,导致硬盘的工作负载不均衡,热点盘的故障率会增高。甚至可能会出现多个硬盘故障,造成存储系统性能下降、业务中断。传统RAID组的重构,应用系统整体性能下降,漫长重构时间、数据丢失风险剧增。在传统RAID技术环境中,硬盘发生故障后,系统会启动热备盘,根据RAID策略进行数据重构。当更换故障硬盘后,需要将热备盘中的数据拷贝到新的硬盘中;此过程需要较长的时间,导致坏盘数据恢复速度慢。以7.2K RPM 4TB硬盘为例,在传统的RAID 5(8D+1P)中,其重构时间在40个小时左右,可靠性风险很大。 在这种大背景下,华为公司在传统RAID技术的基础上创新开发出了RAID 2.0+的新技术,它可以克服传统RAID的缺点,使存储系统实现:负载均衡、性能提升、以及快速的数据恢复。 l 数据在存储池中硬盘上的自动均衡分布,避免了硬盘的冷热不均,从而降低了存储系统整体的故障率。 l 数据在存储池中硬盘上的自动均衡分布,更多的硬盘参与了读写请求,从而大大提高系统整体的读写速度。 l 在硬盘出现故障的情况,存储池内所有来源硬盘参与重构,从而实现快速重构,RAID 2.0+的重构速度是传统RAID的20倍! 你需要了解的RAID 2.0+主要概念: l 硬盘域:由存储阵列中多个硬盘组成,硬盘可选择SSD(高性能层)、SAS(性能层)或者NL-SAS(容量层)中的一种或者多种。 l Chunk(CK):硬盘空间会被划分成若干小块的物理空间;CK的大小为64M。 l 存储池:由来自一种或者多种存储介质上的多个CKG组成。 l Chunk Group(CKG):在存储池中,CK按照RAID策略组合成CKG。 l Extent:存储池空间会被切分一定大小的逻辑空间--Extent;Extent是存储池中申请空间、释放空间和迁移数据的最小单位。Extent大小为512K~64M,默认值4M。 l LUN:由存储池中的多个Extent组成,LUN可以由不同存储介质中的Extent组成,因而可以调动多个硬盘同时读写数据,响应速度快、效率高,也就是实现性能提升。 RAID 2.0+的实现原理如下图所示。 硬盘域是由一种或多种类型的硬盘组成,硬盘在硬盘域中被存储系统划分为更小的块—chunk(如图中数字所标示的块)。存储池是创建于硬盘域中的,可选择由不同的硬盘介质组成,同种硬盘介质组成了存储池的存储层(同种硬盘介质的chunk按照一定的RAID级别组成chunk group,多个同种硬盘介质的chunk group组成了存储池的存储层)。在每个存储层的chunk group中,会划分出比chunk更小的块--extent,同种存储层或不同种存储层的extent组成了LUN。 为什么RAID 2.0+能够比传统RAID实现更快的重构? 在传统RAID技术环境中,硬盘发生故障后,系统会启动热备盘,根据RAID策略进行数据重构。当更换故障硬盘后,需要将热备盘中的数据拷贝到新的硬盘中。在此过程中,重构的速度完全取决于热备盘和更换的硬盘单盘的性能,因此,耗时非常长。 但RAID 2.0+采用了底层虚拟化技术,存储池中的chunk按照RAID级别组成chunk group,因此当硬盘故障时,该硬盘上chunk所在的chunk group会进行重构,即参与重构的硬盘数量非常多。同时热备空间不是来自于一块硬盘,而是随机分配在硬盘域中。如下图所示: 因此,重构的速度不受限于单盘的性能,重构速度非常快,是传统RAID的20倍! RAID 2.0+的RAID级别是怎么体现的?
|