磁盘阵列简称
RAID(Redundant Arrays of Inexpensive Disks)
,有“价格便宜且多余的磁盘阵列”之意。其原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列主要针对硬盘,在容量及速度上,无法跟上
CPU
及内存的发展,提出改善方法。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生的加成效果来提升整个磁盘系统的效能。同时,在储存数据时,利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。
磁盘阵列还能利用同位检查
(Parity Check)
的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将故障硬盘内的数据,经计算后重新置入新硬盘中。而磁盘阵列柜就是装配了众多硬盘的外置的
RAID
。
|
存储的参数
|
|
主机通道接口
|
SCSI
接口、
FC
接口、
iSCSI
接口、
SAS
接口
|
磁盘通道接口
|
SATA、
SCSI、
FC、
SAS
|
服务器与存储直接连接的设备
|
SCSI
卡、
SAS
卡、
RAID
卡、
FC
通道卡、
以太网口、
FC
交换机、
以太网交换机
|
存储网络的架构和优势
|
|
DAS
|
直接附加存储,又称直连存储,便于提高存储空间的利用及管理安装上的效率
|
SAN
|
存储局域网络,因为iSCSI
问世,为了方便区别,业界才分别以FC-SAN
和IP-SAN
|
NAS
|
网络附属存储,是一种将分布、独立的数据整合为大型、集中化管理的数据中心,便于主机访问。
|
DAS
:直接附加存储
|
|
DAN
|
DAS(Driect Attached Storage—
直接附件存储)是指将存储设备通过SAS
线缆或光纤通道直接连接到服务器上。
|
DAS
|
存储直接连接到一台服务器上
SCSI, SAS, iSCSI, FC
块级别 I/O
内部磁盘
具备/不具备RAID保护
外部磁盘
存储系统
基于控制器的RAID引擎
|
内部 DAS
|
|||
内部磁盘
|
内部磁盘
|
内部磁盘
|
内部磁盘
|
无RAID
|
软件RAID
|
主板集成RAID
(ROC
)
|
RAID
主机卡
|
外部DAS
|
|
|
|
内部 DAS
|
|||
内部磁盘
|
内部磁盘
|
内部磁盘
|
内部磁盘
|
无RAID
|
软件RAID
|
主板集成RAID
(ROC
)
|
RAID
主机卡
|
外部DAS
|
|||
通过主机连接卡连接的外部存储系统
|
|||
基于控制器的 RAID
|
内部DAS
优势
|
1
、成本低
2
、驱动器通常在服务器内部
3
、使用迅速
4
、具备一些数据保护
|
外部DAS
优势
|
1
、比将数据存储在客户端更好
2
、增加的可靠性和性能
3
、RAID
保护
4
、增强的特性和功能性
5
、可扩展性
|
SAN
:存储区域网络
|
|
SAN
|
FC—SAN
|
SAN
|
IP—SAN
(ISCSI
)
|
SAN
:存储区域网络
|
|
SAN
(Storage Aera Network
)存储区域网络
|
是一种通过网络方式连接存储设备和应用服务器的存储构架,这个网络专用于主机和存储设备之间的访问。当有数据的存取需求时,数据可以通过存储区域网络在服务器和后台存储设备之间高速传输。
|
SAN
的误区
|
|
SAN
的发展历程较短
|
从90
年代后期兴起,由于当时以太网的带宽有限,而FC
协议在当时就可以支持1Gb
的带宽,因此早期的SAN
存储系统多数由FC
存储设备构成,导致很多用户误以为SAN
就是光纤通道设备,其实SAN
代表的是一种专用于存储的网络架构,与协议和设备类型无关,随着千兆以太网的普及和万兆以太网的实现,人们对于SAN
的理解将更为全面。
|
SAN
的组成
|
1
、SAN
由服务器,后端存储系统,SAN
连接设备组成;
2
、后端存储系统由SAN
控制器和磁盘系统构成,控制器是后端存储系统的关键,它提供存储接入,数据操作及备份,数据共享、数据快照等数据安全管理,及系统管理等一系列功能。
3
、后端存储系统为SAN
解决方案提供了存储空间。使用磁盘阵列和RAID
策略为数据提供存储空间和安全保护措施。
4
、连接设备包括交换机,HBA
卡和各种介质的连接线。
|
SAN
的优点:
|
1
、设备整合,多台服务器可以通过存储网络同时访问后端存储系统,不必为每台服务器单独购买存储设备,降低存储设备异构化程度,减轻维护工作量,降低维护费用;
2
、数据集中,不同应用和服务器的数据实现了物理上的集中,空间调整和数据复制等工作可以在一台设备上完成,大大提高了存储资源利用率;
3
、高扩展性,存储网络架构使得服务器可以方便的接入现有SAN
环境,较好的适应应用变化的需求;
4
、总体拥有成本低,存储设备的整合和数据集中管理,大大降低了重复投资率和长期管理维护成本;
|
FC-SAN
|
|
|
|
IP-SAN
|
|
IP SAN
的基本想法是通过高速以太网络连接服务器和后端存储系统。将SCSI
指令和数据块经过高速以太网传输,继承以太网的优点,实现建立一个开放、高性能、高可靠性,高可扩展的存储资源平台。
将数据块和SCSI
指令通过TCP/IP
协议承载,通过千兆/
万兆专用的以太网络连接应用服务器和存储设备,这样的解决方案称为IP SAN
。
|
NAS
(Network Attached Storage
:网络附属存储)
|
|
是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。按字面简单说就是连接在网络上,
具备资料存储功能的装置,因此也称为“网络存储器”。它是一种专用数据存储服务器。它以数据为中心,将存储设备与服务器彻底分离,集中管理数据,从而释放带宽、提高性能、降低总拥有成本、保护投资。其成本远远低于使用服务器存储,而效率却远远高于后者。
NAS
(Network Attached Storage—
网络附加存储),是一种文件共享服务。拥有自己的文件系统,通过NFS
或CIFS
对外提供文件访问服务
|
|
NAS
定义
|
|
1、
NAS被定义为一种特殊的专用数据存储服务器,包括存储器件(例如磁盘阵列、CD/DVD驱动器、磁带驱动器或可移动的存储介质)和内嵌系统软件,可提供跨平台文件共享功能。NAS通常在一个LAN上占有自己的节点,无需应用服务器的干预,允许用户在网络上存取数据,在这种配置中,NAS集中管理和处理网络上的所有数据,将负载从应用或企业服务器上卸载下来,有效降低总拥有成本,保护用户投资。
2、
NAS本身能够支持多种协议(如NFS、CIFS、FTP、HTTP等),而且能够支持各种操作系统。通过任何一台工作站,采用IE或Netscape浏览器就可以对NAS设备进行直观方便的管理。
|
SAN
和NAS
的区别
|
1
、SAN
是一种网络,NAS
产品是一个专有文件服务器或一个只能文件访问设备。
2
、SAN
是在服务器和存储器之间用作I/O
路径的专用网络。
3
、SAN
包括面向块(SCIS
)和面向文件(NAS
)的存储产品。
4
、NAS
产品能通过SAN
连接到存储设备
|
NAS
网关
|
|
|
|
|
主要协议和相关技术
|
|
SCSI
是什么?
|
1
、微型计算机系统接口(SCSI)
2
、Pronounced “skuzzy”
|
SAS
是什么?
|
1、
串联 SCSI,串联 SCSI (SAS) 是并口SCSI的终结者新的工业标准
2
、提供了非凡的性能提升3-Gbps SAS x4 “
宽”
端口提供累计高达12-Gbps
的带宽
主机连接以及扩展
|
理解SAS “
宽”
端口
|
|
1、
每SAS 线缆是3-Gbps
2、
到驱动器是独立线缆
3、
“x4 宽” 在一个接口中包括4根线缆
4
、2, 3 ,4
线缆仅在当前 I/Os
超出1
号线缆通道性能情况下使用
|
|
SCSI
与SAS
适用于哪里?
|
|
SERVER
—SCSI
—SAN
|
|
|
|
RAID
技术
|
|
RAID
级别
|
|
RAID-0
|
|
1
、RAID0
也称为条带化(stripe
),将数据分成一定的大小顺序的写道阵列的磁盘里,RAID0
可以并行的执行读写操作,可以充分利用总线的带宽,理论上讲,一个由N
个磁盘组成的RAID0
系统,它的读写性能将是单个磁盘读取性能的N
倍。且磁盘空间的存储效率最大(100
%)RAID0
有一个明显的缺点:不提供数据冗余保护,一旦数据损坏,无法恢复。
2
、RAID0
应用于对读取性能要求较高但所存储的数据为非重要数据的情况下。
|
|
RAID-1
|
|
1
、RAID1
成为镜像(mirror
),它将数据完全一致的分别写到工作磁盘和镜像磁盘,因此它的磁盘空间利用率为50
%,在数据写入时时间会有影响,但是读的时候没有任何影响,RAID0
提供了最佳的数据保护,一旦工作磁盘发生故障,系统自动从镜像磁盘读取数据,不会影响用户工作。
2
、RAID1
应用于对数据保护极为重视的应用
|
|
RAID-2
|
|
RAID2
称为纠错海明码磁盘阵列,阵列中序号为2N
的磁盘(第1
、2
、4
、6……
)作为校验盘,其余的磁盘用于存放数据,磁盘数目越多,校验盘所占比率越少。RAID2
在大数据存储额情况下性能很高,RAID2
的实际应用很少。
|
|
RAID-3
|
|
1
、当RAID3
中有数据盘出现损坏,不会影响用户读取数据,如果读取的数据块正好在损坏的磁盘上,则系统需要读取所有同一带区的数据块,然后根据校验值重新构建数据,系统性能受到影响。
2
、RAID3
的校验盘在系统接受大量的写操作时容易形成性能瓶颈,因而适用于有大量读操作如web
系统以及信息查询等应用或持续大块数据流(例如非线性编辑)的应用
|
|
RAID-4
|
|
RAID4
与RAID3
基本一致,区别在于条带化的方式不一样,RAID4
按照块的方式存放数据,所以在写操作时只涉及两块磁盘,数据盘和校验盘,提高了系统的IO
性能。但面对随机的分散的写操作,单一的校验盘往往成为性能瓶颈
|
|
RAID-5
|
|
RAID5
与RAID3
的机制相似,但是数据校验的信息被均匀的分散到的阵列的各个磁盘上,这样就不存在并发写操作时的校验盘性能瓶颈。阵列的磁盘上既有数据,也有数据校验信息,数据块和对应的校验信息会存储于不同的磁盘上,当一个数据盘损坏时,系统可以根据同一带区的其他数据块和对应的校验信息来重构损坏的数据。
|
RAID-6
|
|
1
、RAID 6
提供两级冗余,即阵列中的两个驱动器失败时,阵列仍然能够继续工作
2
、一般而言,RAID 6
的实现代价最高,因为RAID 6
不仅要支持数据的恢复,又要支持校验的恢复,这使RAID 6
控制器比其他级R A I D
更复杂和更昂贵。
3
、1. RAID 6
的校验数据当对每个数据块执行写操作时, RAID 6
做两个独立的校验计算,因此,它能够支持两个磁盘的失败。为了实现这个思想,目前基本上有两个已经接受的方法:使用多种算法,如X O R
和某种其他的函数。
在不同的数据分条或者磁盘上,使用排列的数据。2. RAID 6
的一维冗余,RAID 6
的第一种方法是用两种不同的方法计算校验数据。实现这个思想最容易的方法之一是用两个校验磁盘支持数据磁盘,第一个校验磁盘支持一种校验算法,而第二个磁盘支持另一种校验算法,使用两种算法称为P + Q
校验。一维冗余是指使用另一个校验磁盘,但所包含的分块数据是相同的。例如,P
校验值可能由X O R
函数产生,这样,Q
校验函数需要是其他的某种操作,一个很有力的侯选者是Reed Solomon
误差修正编码的变体,这个误差修正编码一般用于磁盘和磁带驱动器。假如两个磁盘失败,那么,通过求解带有两个变量的方程,可以恢复两个磁盘上的数据,这是一个代数方法,可以由硬件辅助处理器加速求解。
|
|
RAID-10
|
|
RAID10
是RAID1
和RAID0
的结合,也称为RAID
(0+1
),先做镜像然后做条带化,既提高了系统的读写性能,有提供了数据冗余保护,RAID10
的磁盘空间利用率和RAID1
是一样的,为50
%。RAID10
适用于既有大量的数据需要存储,有对数据安全性有严格要求的领域,比如金融,证券等。
|
|
JBOD
|
|
|