什么是RAID?

什么是RAID?,第1张

RAID(独立磁盘冗余阵列)是一种数据存储虚拟化技术,将多个物理磁盘驱动器组件组合到一个或多个逻辑单元中,以实现数据冗余和/或提高性能的目的。

数据以多种方式(称为RAID级别)分布在驱动器上,具体取决于所需的冗余和性能级别。不同的方案按资料分布布局以单词“ RAID”命名,后跟一个数字,例如RAID 0或RAID1。每种方案或RAID级别在关键目标之间提供了不同的平衡:可靠性、性能和容量。大于RAID 0的RAID级别可提供针对不可恢复的扇区读取错误以及整个物理驱动器故障的保护。

RAID技术主要具有以下三个基本功能:

(1)通过磁盘数据条带化,可以实现对数据的块访问,减少了磁盘的机械搜索时间,提高了数据访问速度。

(2)通过同时排列数组中的多个磁盘,可以减少磁盘的机械搜索时间,并提高数据访问速度。

(3)通过镜像或存储同位信息,可以实现数据的冗余保护。

RAID 0和RAID 1之间的区别:

1. RAID 0读写速度快,数组容量是数组磁盘的总容量,无数据备份功能,安全性较差。

2. RAID 1的读写速度如单磁盘,容量为单磁盘容量,但磁盘互相备份,安全性高。

RAID 0的特点:

RAID 0的缺点是它不提供数据冗余,一旦用户数据损坏,损坏的数据将无法恢复。当RAID中任何硬盘驱动器出现故障时,RAID 0运行都可能导致整个数据损坏。通常不建议企业用户单独使用。

RAID 1的特征:

RAID 1通过硬盘数据镜像实现数据冗余,保护数据,在两个磁盘上生成备份数据,并且在原始数据繁忙时可以直接从镜像备份中读取资料,因此RAID 1可以提供读取性能。

RAID 0

RAID 0由条带化组成,但没有镜像或同位。与跨区卷相比,RAID 0卷的容量是相同的。它是集合中磁盘容量的总和。但是由于条带化将每个文件的内容分配到集合中的所有磁盘之间,因此任何磁盘的故障都会导致所有档(整个RAID 0卷)丢失。跨区卷损坏至少可以将档保留在正常运行的磁盘上。 RAID 0的好处是,对任何档的读写操作的吞吐量都乘以磁盘数量,因为与跨区卷不同,读写操作是同时进行的,而且代价是驱动器故障的完全脆弱性。实际上,平均故障率比等效的单个非RAID驱动器高。

RAID 1

RAID 1由数据镜像组成,没有同位或分段。数据被相同地写入两个驱动器,从而产生驱动器的“镜像集”。因此,RAID中的任何驱动器均可满足任何读取请求。如果将请求广播到RAID中的每个驱动器,则可以由首先访问数据的驱动器(根据其查找时间和循环等待时间)对请求进行服务,从而提高性能。如果针对控制器或软件进行了优化,则持续读取吞吐量将接近集合中每个驱动器的吞吐量总和。写入较慢,因为写入的数据必须更新到每个驱动器,而最慢的驱动器会限制写入性能。但只要有一个驱动器正常工作,该数组就会继续运行。

下面是RAID级别的对比表。

磁盘阵列是由很多个磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。

磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任意一  个硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后重新置入新硬盘中。

硬RAID通常有2种解决方案

1外接储存柜(一般企业大数据应用)

2磁盘阵列卡(个人用户或数据不大)

3其他情况 ,主板自带RAID (一般不使用稳定性不保证)

常用的民用级NAS 通常都是软RAID

RAID从0开始到7共8种 以及RAID10和RAID01

是把连续的数据分散到多个磁盘上存取,这样,系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求。这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能。

RAID 0 并不是真正的RAID结构, 没有数据沉余,没有数据校验的磁盘陈列 。实现RAID 0至少需要两块以上的硬盘,它将两块以上的硬盘合并成一块,数据连续地分割在每块盘上。 因为带宽加倍,所以读/写速度加倍, 但RAID 0在提高性能的同时,并没有提供数据保护功能,只要任何一块硬盘损坏就会丢失所有数据。因此RAID 0 不可应用于需要数据高可用性的关键领域。

对磁盘数量没有要求,磁盘利用率为100%(受限于最小盘)。不需要热备盘。所有盘一起工作。

读写受限于最慢的硬盘*N。容量受限于最小盘*N

RAID1是将一个两块硬盘所构成RAID磁盘阵列,其容量仅等于一块硬盘的容量,因为另一块只是当作数据“ 镜像 ”。RAID 1 磁盘阵列 显然是最可靠的一种阵列,因为它总是保持一份完整的数据备份。它的性能自然没有RAID 0 磁盘阵列 那样好,但其数据读取确实较单一硬盘来的快,因为数据会从两块硬盘中较快的一块中读出。

2块硬盘为一组,数据相互备份,磁盘利用率为最低只有50%。不需要热备盘。

写受限于最慢的硬盘。读受限于最快的硬盘。容量受限于最小盘

比着RAID0 多了一个校验盘,校验盘损坏数据无法回复。既不安全,速度也不快,磁盘利用率不高

RAID 5 是一种存储性能、 数据安全 和存储成本兼顾的存储解决方案。 RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供 数据安全 保障,但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。RAID 5具有和RAID 0相近似的数据读取速度,只是多了一个 奇偶校验 信息,写入数据的速度比对单个 磁盘 进行写入操作稍慢。同时由于多个数据对应一个 奇偶校验 信息,RAID 5的磁盘空间利用率要比 RAID 1 高,存储成本相对较低,是运用较多的一种解决方案

最少3块硬盘为一组,磁盘利用率为N-1,需要热备盘。CPU开销大。

RAID是把校验以及数据分别储存在所以盘里,当有一块硬盘损坏,其他盘里的数据配合校验数据就可以恢复损坏硬盘内的数据。(更换硬盘重建RAID或着热备盘替换). 避免了校验盘损坏导致数据无法恢复情况。

RAID5在损坏一个硬盘的情况下还可以继续进行校验以及数据储存,这时需要及时更换损坏磁盘(重建RAID)避免剩余磁盘超负荷运作而造成更多硬盘损坏。

如果出现第2个硬盘损坏则数据很难恢复。

RAID5 重构非常容易失败,多次重构容易造成磁盘损坏。

大容量磁盘的先天缺陷,大概每12TB数据出现一次 不可恢复性读取错误 ( URE ),重构RAID时如果出现 URE 则系统会认为磁盘有错误,这时重构失败。所以RAID5会出现多次重构失败事情,增加正常使用硬盘负荷,造成硬盘损坏。

RAID6技术是在 RAID 5 基础上,为了进一步加强数据保护而设计的一种RAID方式,实际上是一种扩展RAID 5等级。与RAID 5的不同之处于除了每个 硬盘 上都有同级数据XOR校验区外,还有一个针对每个 数据块 的XOR校验区。当然,当前盘 数据块 的校验数据不可能存在当前盘而是交错存储的,具体形式见图。这样一来,等于每个 数据块 有了两个校验保护屏障(一个分层校验,一个是总体校验),因此RAID 6的 数据冗余 性能相当好。但是,由于增加了一个校验,所以写入的效率较RAID 5还差,而且控制系统的设计也更为复杂,第二块的校验区也减少了有效 存储空间 。

最少4块硬盘为一组,磁盘利用率为N-2. 因为要经过2次效验CPC开销很大,磁盘读写也没有RAID5块

可以允许2块硬盘同事损坏(更换后数据可以恢复)。数据比较安全。极大降低大容量硬盘在使用后期的风险

有专利需要收费(略过)

raid01比较缺乏安全性,且故障时难以恢复,实际应用中几乎没有人会选择。底层RAID0 提升速度 上次RAID1相互备份(略过)

RAID 1+0 也被称为RAID 10标准,实际是将RAID 1和RAID 0标准结合的产物,在连续地以位或字节为单位分割数据并且并行读/写多个磁盘的同时,为每一块磁盘作 磁盘镜像 进行 冗余 。它的优点是同时拥有RAID 0的超凡速度和RAID 1的数据高可靠性,但是CPU占用率同样也更高,而且磁盘的利用率比较低。由于利用了RAID 0极高的读写效率和RAID 1较高的 数据保护 、恢复能力,使RAID 10成为了一种性价比较高的等级,目前几乎所有的 RAID控制卡 都支持这一等级。但是,RAID 10对存储容量的利用率和RAID 1一样低,只有50%。因此,RAID10即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构,可以达到既高速又安全的目的,RAID 10能提供比RAID 5更好的性能。这种新结构的可扩充性不好,这种解决方案被广泛应用,使用此方案比较昂贵。

重构速度快, 安全系数高,磁盘利用率50% 结合RAID 1 -0 的特性

JBOD(just a bunch of disks,简单磁盘 捆绑 ,或有时称简单驱动捆绑)是一个不太正规的术语,官方术语称作“Spanning”,它用来指还没有根据RAID( 独立磁盘冗余阵列 )系统配置以增加容错率和改进数据访问性能的 电脑硬盘 。

RAID系统在多个磁盘上冗余地存储了同样的数据,而这多个磁盘在操作系统看来就像一个磁盘。虽然JBOD也让多个磁盘看来似乎只有一个,但它是通过把多个驱动器合并成一个大的逻辑磁盘来做到这一点的。JBOD使用独立的磁盘并没有带来任何好处,也不能提供任何RAID所能带来的容错或是更好的性能等。

JBOs 模式下数据从第一块硬盘开始,一直往后边储存,系统只能看到包含所有硬盘的大分区,而不能看到单个硬盘。第一块硬盘为系统盘如损坏数据则无法读取。存储方式为单盘储存,不储存的硬盘处于闲置状态。(单盘模式)

根据磁盘的数量和容量  自动选择用哪个RAID模式

方便对RAID不太熟悉的人。硬盘数据只能群辉上读取。

RAID就是一种由多块廉价磁盘构成的冗余阵列,在操作系统下是作为一个独立的大型存储设备出现。

RAID可以充分发挥出多块硬盘的优势,可以提升硬盘速度,增大容量,提供容错功能够确保数据安全性,易于管理的优点,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。

扩展资料

优点

提高传输速率。RAID通过在多个磁盘上同时存储和读取数据来大幅提高存储系统的数据吞吐量(Throughput)。

在RAID中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个磁盘驱动器几倍、几十倍甚至上百倍的速率。

这也是RAID最初想要解决的问题。因为当时CPU的速度增长很快,而磁盘驱动器的数据传输速率无法大幅提高,所以需要有一种方案解决二者之间的矛盾。RAID最后成功了。

通过数据校验提供容错功能。普通磁盘驱动器无法提供容错功能,如果不包括写在磁盘上的CRC(循环冗余校验)码的话。RAID容错是建立在每个磁盘驱动器的硬件容错功能之上的,所以它提供更高的安全性。

在很多RAID模式中都有较为完备的相互校验/恢复的措施,甚至是直接相互的镜像备份,从而大大提高了RAID系统的容错度,提高了系统的稳定冗余性。

磁盘阵列其样式有三种,一是外接式磁盘阵列柜、二是内接式磁盘阵列卡,三是利用软件来仿真。

外接式磁盘阵列柜最常被使用大型服务器上,具可热交换(Hot Swap)的特性,不过这类产品的价格都很贵。

内接式磁盘阵列卡,因为价格便宜,但需要较高的安装技术,适合技术人员使用操作。硬件阵列能够提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。

它能提供性能、数据保护、可靠性、可用性和可管理性的解决方案。阵列卡专用的处理单元来进行操作。

利用软件仿真的方式,是指通过网络操作系统自身提供的磁盘管理功能将连接的普通SCSI卡上的多块硬盘配置成逻辑盘,组成阵列。

软件阵列可以提供数据冗余功能,但是磁盘子系统的性能会有所降低,有的降低幅度还比较大,达30%左右。因此会拖累机器的速度,不适合大数据流量的服务器。

由加利福尼亚大学伯克利分校(University of California-Berkeley)在1988年,发表的文章:“A Case for Redundant Arrays of Inexpensive Disks”。

文章中,谈到了RAID这个词汇,而且定义了RAID的5层级。伯克利大学研究目的是反映当时CPU快速的性能。CPU效能每年大约成长30~50%,而硬磁机只能成长约7%。

研究小组希望能找出一种新的技术,在短期内,立即提升效能来平衡计算机的运算能力。在当时,柏克莱研究小组的主要研究目的是效能与成本。

另外,研究小组也设计出容错(fault-tolerance),逻辑数据备份(logical data redundancy),而产生了RAID理论。

研究初期,便宜(Inexpensive)的磁盘也是主要的重点,但后来发现,大量便宜磁盘组合并不能适用于现实的生产环境,后来Inexpensive被改为independent,许多独立的磁盘组。

独立磁盘冗余阵列(RAID,redundant array of independent disks)是把相同的数据存储在多个硬盘的不同的地方(因此,冗余地)的方法。

通过把数据放在多个硬盘上,输入输出操作能以平衡的方式交叠,改良性能。因为多个硬盘增加了平均故障间隔时间(MTBF),储存冗余数据也增加了容错。

参考资料:百度百科-RAID


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/24249.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-02-16
下一篇2023-02-16

发表评论

登录后才能评论

评论列表(0条)

    保存