RAID技术 Redundant Array of Independent Disks

由独立的磁盘组成的具有冗余特性的阵列。

有两个特性:

  1. 阵列:需要很多磁盘来组成
  2. 冗余:允许某块磁盘损坏之后,数据仍然可用

目前,单块磁盘容量只有几T,对于现代应用程序来说远远不够。为了提供容量更大的磁盘,发明了RAID技术。

 

1 七种RAID简介

RAID 0

  • 4个磁盘组成一个阵列
  • 4个扇区组成的块作为基本单元
  • 不同磁盘的相同偏移处的块组合成Stripe
  • 数据写入:数据被分成多块写入4个磁盘,而不是顺序写入一个磁盘,这就大大提高了速度 
  • 缺点:其中一块磁盘废掉,数据全部丢失。

RAID 1

  • 一个数据盘,一个影子盘
  • 每次写,写成功两块盘才算成功
  • 没有提供读副本的功能,只有数据出现损坏,才会读第二副本
  • 缺点:短板效应,速度取决于最慢的盘,容量取决于最小的盘。

RAID 2

  • 两块数据盘,一块校验盘
  • 校验算法使用汉明码,可以校验,并具有纠错一位的能力。
  • 每个IO下发的数据被以位为单位平均打散在所有数据盘上。
  • 缺点:校验盘数量太多,开销太大,成本昂贵。

RAID 3

  • 使用逻辑运算“异或XOR”来进行计算校验位
  • 将数据盘的每一位之间做XOR运算,然后将结果写入校验盘的对应位置。
  • 每次IO的大小:4KB,并要求所有数据盘主轴同步,不然就会等待最慢的那个数据盘完成。
  • 优点:校验效率较高,成本减少
  • 缺点:不支持IO并发,无法纠正错误。对随机小块读写时,一个很小的IO会占用所有盘。

RAID 4

  • 为了解决RAID 3中小块随机读写问题,增大了“条带深度”
  • 如果一个IO过来,这个IO块小于条带深度,那么这次IO就被完全禁锢在一块磁盘上,只会用到一块磁盘。
  • 缺点:校验盘是瓶颈。

RAID 5

  • 目的是支持并发IO。
  • 校验盘分割打散在数据盘上。
  • 连续性能不如RAID 3。
  • 随机读性能高。
  • 写性能较差。写过程:新数据过来->读取待更新扇区的原数据->读取校验数据->计算新数据校验数据->将新数据和新校验数据写到磁盘。

RAID 6

  • 目的是为了解决超过一块盘损坏就丢数据的问题。
  • 增加了校验码,通过组成方程组求解多个未知数。
  • 缺点:因为要多读出一个校验数据,写性能更差了。

 

2 关于几个与IO相关的重要概念

IO可以分为读写IO、大小块IO、连续/随机IO、顺序/并发IO、稳定/突发IO、持续/间断IO和实虚IO。

下面我们来分别了解一下这几种IO。

1 读/写IO

一次IO,就是发指令从磁盘读写某段序号连续的扇区内从。

指令一般是通知磁盘从某个扇区开始,并给出从这个初始扇区往后读取的连续扇区个数,同时给出动作是读还是写。

一个IO索要提取的扇区段一定是连续的。

2 大/小块IO

指控制器的指令中给出的连续读取扇区数目的多少。如果数目很大,比如128、64等,就是大块IO。如果很小,比如1、4、8等,就算小块IO。

3 连续/随机IO

连续和随机是指本次IO给出的初始扇区地址和上一次IO的结束扇区地址是不是完全连续或者像个不多的。

如果是,则本次IO应该算是一个连续IO。

如果相差太大,则算一次随机IO。

4 顺序/并发IO

磁盘控制器如果可以同时对一个RAID系统中的多块磁盘同时发送IO指令,并且这些最底层的IO数据包含了文件系统下发的一个IO的数据,则此时为顺序IO。

5 持续/间断IO

持续不断地发送或者接受IO请求数据流,这种情况为持续IO。

6 稳定/突发IO

某存储设备或者某程序在一段时间内接受或者发送的IOPS以及throughput保持响度稳定和恒定,则称为稳定IO。

如果单位时间的IOPS或者throughput突然猛增,则为突发IO。

7 实/虚IO

读写实际文件或者磁盘扇区数据的,称为实IO

对文件元数据操作的、或针对磁盘发送的非实体数据IO请求的控制性IO,称为虚IO。

 

参考资料

《大话存储2-存储系统架构与底层原理极限剖析》 

 

 

 

 

大话存储 3 - 七种磁盘RAID技术的更多相关文章

  1. 七种RAID技术

    想把好多硬盘组在一起使用的基本方式为:连接所有硬盘,先向第一个硬盘中写数据,满了之后,再向第二个硬盘上写数据,如此只是简单的连通了多个硬盘. 再此基础上发展了RAID技术:由独立磁盘组成的具有冗余特性 ...

  2. 存储系列之 RAID技术原理简介

    引言:RAID技术是现代大规模存储的基础,“基础(技术)是拿来革命的”.我查raid相关资料时,查布尔运算,竟然一路查到“香农原理”,这不是有个视频中HW的任总提到的吗,多基础的东西,任总却毫不含糊, ...

  3. 存储入门 – RAID技术(大图解释)

    对于RAID,一直都知道个概念,但是对于细节没有去仔细的研究过.正好昨天Training的时候, 老师讲解了RAID的内容,所以顺便就整理一下.很多内容都是参考了ISMv2这本书. RAID中用到的技 ...

  4. 大话存储4——RAID磁盘阵列

    RAID是英文Redundant Array of Independent Disks(独立磁盘冗余阵列),简称磁盘阵列.下面将各个级别的RAID介绍如下. RAID0 条带化(Stripe)存储.理 ...

  5. 几种RAID技术比较

    http://book.51cto.com/art/201310/412862.htm RAID(廉价磁盘冗余阵列)技术主要是为了改善磁盘的访问延迟,增强磁盘的可用性和容错能力.目前服务器级别的计算机 ...

  6. 图文并茂 RAID 技术全解 – RAID0、RAID1、RAID5、RAID10

    RAID 技术相信大家都有接触过,尤其是服务器运维人员,RAID 概念很多,有时候会概念混淆.这篇文章为网络转载,写得相当不错,它对 RAID 技术的概念特征.基本原理.关键技术.各种等级和发展现状进 ...

  7. 【转】RAID 技术发展综述

    原文地址:https://blog.csdn.net/liuaigui/article/details/4581970   摘要 :现代企业信息化水平不断提高,数据已经取代计算成为了信息计算的中心.这 ...

  8. 图文并茂 RAID 技术全解 – RAID0、RAID1、RAID5、RAID100

    RAID 技术相信大家都有接触过,尤其是服务器运维人员,RAID 概念很多,有时候会概念混淆.这篇文章为网络转载,写得相当不错,它对 RAID 技术的概念特征.基本原理.关键技术.各种等级和发展现状进 ...

  9. RAID技术全解图解-RAID0、RAID1、RAID5、RAID100【转】

    图文并茂 RAID 技术全解 – RAID0.RAID1.RAID5.RAID100…… RAID 技术相信大家都有接触过,尤其是服务器运维人员,RAID 概念很多,有时候会概念混淆.这篇文章为网络转 ...

随机推荐

  1. maven-插件-不同的开发环境指定

    通常指定 dev环境 和 prod 环境 <profiles> <profile> <id>prod</id> <build> <re ...

  2. SQL 语句语法简介(一)

    语句分类 SQL 命令一般分为三类:DQL.DML.DDL. 一.DDL语句. 1.1建表语句 CREATE TABLE table_name( col01_name data_type, col02 ...

  3. Python中bisect的使用

    在<Think Python>中第十章的练习中,涉及到了分半查找的bisect模块.为此,在网上查阅了Python中bisect模块的相关内容.有几个链接相对权威和明白: 1> ht ...

  4. 【JS点滴】substring和substr以及slice和splice的用法和区别。

    那么就由一道笔试题引入吧,已知有字符串a=”get-element-by-id”,写一个function将其转化成驼峰表示法”getElementById”: var a = "get-el ...

  5. Flux --> Redux --> Redux React 基础实例教程

    本文的目的很简单,介绍Redux相关概念用法 及其在React项目中的基本使用 假设你会一些ES6.会一些React.有看过Redux相关的文章,这篇入门小文应该能帮助你理一下相关的知识 一般来说,推 ...

  6. Netbeans 8.0配置Python开发环境

    1. 菜单栏:工具->插件->设置->添加 配置如下信息: http://deadlock.netbeans.org/hudson/job/nbms-and-javadoc/last ...

  7. mysql数据库自动备份脚本

    #!/bin/bash #功能说明:本功能用于备份mysql数据库 #编写日期:2018/05/17 PATH=/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin ...

  8. 221. 链表求和 II

    假定用一个链表表示两个数,其中每个节点仅包含一个数字.假设这两个数的数字顺序排列,请设计一种方法将两个数相加,并将其结果表现为链表的形式. 样例 样例 1: 输入t:6->1->7 2-& ...

  9. 撩课-Web大前端每天5道面试题-Day27

    1.浏览器缓存? 浏览器缓存分为强缓存和协商缓存.当客户端请求某个资源时,获取缓存的流程如下: 先根据这个资源的一些 http header 判断它是否命中强缓存, 如果命中,则直接从本地获取缓存资源 ...

  10. 创建一个jdbc连接

    本文介绍如何建立一个jdbc连接进行数据库查询操作. 创建一个java工程,导入jar包. 作者使用mysql数据库,建立jdbc连接需要mysql数据库驱动jar包和jdbc连接jar包. 建立jd ...