什么是磁盘阵列RAID

什么是磁盘阵列?

磁盘阵列的由来:

磁盘阵列,时事所趋:

磁盘阵列有那些优点:

各阶层磁盘阵列(RAID)介绍:
RAID 0:Striping/Span (切分/延展)

RAID 1:Mirroring (磁盘镜射)

RAID 0+1:Mirror + Striping (磁盘镜射+切分/延展)

RAID 3:Parallel with Parity (平行同位检查)

RAID 5:Striping with Rotating Parity (切分/延展+轮转同位)

前言:

现在己经有很多主机板都内建了IDE RAID芯片,除了提供ATA/133功能外,也提供了磁盘阵列功能,给使用者一个完整的IDE周边解决方案。不过,应该还有很多人弄不清楚磁盘阵列是什么,对磁盘阵列的使用及工作原理也有很多疑问。在这里我们就来介绍一下磁盘阵列(RAID)的概念与工作原理,相信对各位会有所帮助。

什么是磁盘阵列?

磁盘阵列简称RAID(Redundant Arrays of Inexpensive Disks),有”价格便宜且多余的磁盘阵列”之意。其原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列主要针对硬盘,在容量及速度上,无法跟上CPU及内存的发展,提出改善方法。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生的加成效果来提升整个磁盘系统的效能。同时,在储存数据时,利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。

磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将故障硬盘内的数据,经计算后重新置入新硬盘中。

磁盘阵列的由来:

由美国柏克莱大学(University of California-Berkeley)在1987年,发表的文章:”A Case for Redundant Arrays of Inexpensive Disks”。文章中,谈到了RAID这个字汇,而且定义了RAID的5层级。柏克莱大学研究其研究目的为,反应当时CPU快速的性能。CPU效能每年大约成长30~50%,而硬磁机只能成长约7%。研究小组希望能找出一种新的技术,在短期内,立即提升效能来平衡计算机的运算能力。在当时,柏克莱研究小组的主要研究目的是效能与成本。

另外,研究小组也设计出容错(fault-tolerance),逻辑数据备份(logical data redundancy),而产生了RAID 理论。研究初期,便宜(Inexpensive)的磁盘也是主要的重点,但后来发现,大量便宜磁盘组合并不能适用于现实的生产环境,后来Inexpensive被改为independence,许多独立的磁盘组。

磁盘阵列,时事所趋:

自有PC以来,硬盘是最常使用的储存装置。但在整个计算机系统架构中,跟CPU与RAM来比,硬盘的速度是PC中最弱的设备之一。所以,为了加速计算机整体的数据流量,增加储存的吞吐量,进阶改进硬盘数据的安全,磁盘阵列的设计因应而生。

硬盘随着科技的日新月异,现在其容量已达40GB以上,转速到了1万转,甚至15000转,而且价格实在是很便宜,再加现在企业流行,人力资源规画(Enterprise Resource Planning:ERP)是每个公司建构网络的主要目标。所以,利用局域网络来传递数据,服务器所使用的硬盘显得非常重要,除了容量大、速度快之外,稳定更是基本要求。基于此因,磁盘阵列开始广泛的应用在个人计算机上。

磁盘阵列其样式有三种,一是外接式磁盘阵列柜、二是内接式磁盘阵列卡,三是利用软件来仿真。外接式磁盘阵列柜最常被使用大型服务器上,具可热抽换(Hot Swap)的特性,不过这类产品的价格都很贵。内接式磁盘阵列卡,因为价格便宜,但需要较高的安装技术,适合技术人员使用操作。另外利用软件仿真的方式,由于会拖累机器的速度,不适合大数据流量的服务器。

由上述可知,现在IDE磁盘阵列大行其道的道理;IDE接口硬盘的稳定度与效能表现已有很大的提升,加上成本考量,所以采用IDE接口硬盘来作为磁盘阵列的决解方案,可说是最佳的方式。

磁盘阵列有那些优点:
1.传输速率快
2.储存容量可提升
3.提升I/O每秒的数量
4.增加数据安全性及稳定性
5.大量数据快速及简易管理
6.增加可用运时间,减少维护

各阶层磁盘阵列(RAID)介绍:

磁盘阵列是由2个以上的硬盘,仿真一个逻辑硬盘出现在系统中;使用磁盘阵列控制器以达成其存在,利用不同数组形式,仿真各种层级。现在我们先来了解磁盘阵列(RAID)到底有几种模式,一般最常提到及应用的RAID层级分为0、1、0+1、3及5。另外还有一些极少用到的RAID 4及RAID 6在此我们就不提它了。

以下就是各个阶层的介绍及图解:
RAID 0:Striping/Span (切分/延展)
RAID 1:Mirroring (磁盘镜射)
RAID 0+1:Mirror + Striping (磁盘镜射+切分/延展)
RAID 3:Parallel with Parity (平行同位检查)
RAID 5:Striping with Rotating Parity (切分/延展+轮转同位)

RAID 0:Striping/Span (切分/延展)

RAID 0,它是将数据储存在2个以上的硬盘机,其将全部磁盘驱动器的储存容量合并,藉由将数据切分到全部的磁盘驱动器上,进行平行读写,而达到提高效能增加容量。但是缺点是完全没有容错能力,只要有一个磁盘故障,就会导致数组磁盘的所有数据,毁于一旦无法挽回。

以下是原理示意图及实体概念图:

RAID 1:Mirroring (磁盘镜射)

RAID 1,必须由2个以上的硬盘所组成,由磁盘阵列(RAID)来控制,将数据同时写入第1个与第2个硬盘,其2组硬盘上的数据完全相同,也就是其中一个硬盘是用来作备份用途;当其中有一个硬盘故障时,系统照常运作正常。RAID 1是所有RAID阶层上,经济效益最好,效能很高,极佳的数据安全性。是所有阶层中使用最多最广最符合当初RAID设计概念的一种。唯一小缺点是,其数组磁盘容量是全部硬盘容量的一半。

RAID 0+1:Mirror + Striping (磁盘镜射+切分/延展)

RAID 0+1,是结合了RAID 0与1两种模式,这个阶层须具备4个或以上的双数硬盘所组成。这个模式是由2个硬盘遵守RAID 0规范,设定成一组,再由每组间遵循RAID 1的规范,使RAID 0+1拥有容错力及整体读写速度与数据安全性。不过,缺点是成本很高。

RAID 3:Parallel with Parity (平行同位检查)

RAID 3,最少须3个硬盘或以上,这个阶层的磁盘阵列具备了同位高阶智能型算法,利用一个硬盘来储存其运算出来的同位值的数据。当数组磁盘中有一个硬盘发生故障时(当然不能是同位碟),只要换上新硬盘后,磁盘阵列控制器就能利用同位碟的数据,重新演算得到其旧有数据并回写建立。因为其同位检查数据是将数据切割成数个区段,利用XOR算法计算出同位数据;而其区段以Bytes计算时,称为RAID 3,如果是以Block计算时,就称为RAID 4。所以RAID 3在整体读写效能会较慢较差,但在成本上会比RAID 0+1还省一点,其数组磁盘整体容量计算公式为N-1。

RAID 5:Striping with Rotating Parity (切分/延展+轮转同位)

RAID 5,最少须3个硬盘,其工作原理与RAID 3相似,主要差别是其同位数据没有固定在同个硬盘,是以轮流方式储存在每个硬盘上,故称轮转同位。当磁盘阵列控制器利用XOR演算出同位检查数据后,会随着数据分别写入各台硬盘上,因此整体读写效能比RAID 3要好一些,当然比RAID 0要差。不过在大型数据处理时,需同时读写多个硬盘,而同位检查是由磁盘阵列控制器的XOR逻辑所控制的,所以数据处理越大越多时,一定会有所遗失,但这个阶层的RAID还是可以提供很高的容错能力…

此条目发表在点滴 Diary分类目录。将固定链接加入收藏夹。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注