RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程

最近一台ThinkCenter RS450服务器硬盘亮黄灯,引起进入系统很慢,于是将业务系统备份后,对该服务器硬盘进行修复。

该服务器的总共三块硬盘组件了Raid5,因此待第一块盘亮红灯后,尝试进入Raid管理器,将报错的盘(红色显示)进行rebuliding操作,操作完成后,一直无法再online,多次rebuild之后,发现该硬盘有“咯吱咯吱”异响,判断该硬盘磁盘有问题。

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第1张图片

因业务已备份,因此在短时间再买到合适硬盘补充的情况下,我决定将剩下的两块盘做Raid 1,因为每块盘都有600G的空间,两块做Raid 1互备,单盘完全可以满足业务的建立。

下面首先介绍一下RAID 的分类基础知识,其次介绍LSI MegaRAID SAS 9240-4i阵列卡创建Raid 1的过程即关键参数解析,最后介绍安装windows server 2008 r2过程中出现的与阵列卡相关的问题。

一、RAID 的分类基础知识

RAID 0
     RAID 0又称为Stripe(条带化)或Striping,它的存储性能是RAID级别中最高的。RAID 0是将连续的数据分散到多个磁盘上存取,当系统有数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求。这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性能。

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第2张图片


RAID 0工作原理图

   以上图为例,利用3块硬盘来做RAID 0阵列,系统向三个磁盘组成的逻辑磁盘(RADI 0 磁盘组)发出的I/O数据请求被转化为3项操作,其中的每一项操作都对应于一块物理硬盘。我们从图中可以清楚的看到通过建立RAID 0,原先顺序的数据请求被分散到所有的三块硬盘中同时执行。从理论上讲,三块硬盘的并行操作使同一时间内磁盘读写速度提升了3倍。 但由于总线带宽等多种因素的影响,实际的提升速率会低于理论值。

   RAID 0的优点是可以提供非常高的磁盘读写性能,但是却并不提供数据冗余,当一块硬盘发生故障,整个数据都将无法恢复。 RAID 0适用于对性能有较高要求,且对数据安全性要求不高的领域,如个人用户,采用RAID 0可以大幅提高硬盘的存储性能。
  RAID 1
  RAID 1又称为Mirror或Mirroring(镜像),它可以最大限度的保证用户数据的可用性和可修复性。RAID 1的操作方式是把用户写入磁盘的数据百分之百地自动复制到另外一个硬盘上。

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第3张图片


RAID 1工作原理图

  以上图为例,当要进行数据读取时,系统先从RAID 0的源盘读取数据,如果可以成功读取,则系统不去访问备份盘上的数据,如果读取源盘失败,系统会自动转而读取备份盘上的数据。由于对所存的数据进行百分之百的备份,因此在所有RAID级别中,RAID 1可以提供最高的数据安全性。不过这样也会降低存储空间的利用率,存储的成本较高。
  RAID 10
  RAID 10是利用以上所介绍过的RAID 0和RAID 1来实现的一种组合应用方式。我们用4块磁盘组成RAID 10为例来看看它的具体工作原理。它是将4块磁盘两两分组,每组中两块磁盘的数据互为备份,系统要进行数据存储或读写时,会将连续的数据分散到两个组来存取。

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第4张图片

RAID10工作原理图

  RAID 10是一种存储性能和数据安全二者兼顾的方案。它在提供与RAID 1同样数据安全的同时,也提供了与RAID 0近似的存储性能。不过它的缺点与RAID一样,具有存储成本较高的特点。
RAID 5
  RAID 5 是一种兼顾性能、数据安全和存储成本的阵列方式。以利用4块磁盘组成RAID 5为例,在下图中,P0为D0,D1和D2的奇偶校验信息,其它以此类推。图中可以看出,RAID 5并不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,当阵列中某一个磁盘数据发生损坏后,利用剩下的数据和相应的奇偶校验信息就可以恢复被损坏的数据。

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第5张图片


RAID5工作原理图

   可以看出,RAID 5能够为系统提供数据安全保障,但安全程度比做镜像备份低,而磁盘空间的利用率又比镜像备份要高。而且RAID 5具有很好的数据读取速度。由于多个数据才对应一个奇偶校验信息,因此RAID 5方式的存储成本也相对较低。 正是由于RAID 5有如此多的优点,因而在做磁盘阵列时,通常会被优先考虑。

二、LSI MegaRAID SAS 9240-4i阵列卡创建Raid 1的过程即关键参数解析

LSI MegaRAID SAS 9240-4i阵列卡与9260基本同外观同驱动。如下图:

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第6张图片

利用两块盘创建的Raid1如下所示:

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第7张图片

下面就是创建过程,重启服务器,一般启动服务器后都会有相关的提示,进入raid管理界面,显示器上会出现Ctrl -H提示,

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第8张图片

按下Ctrl -H组合键后,自检完成就会进入Raid卡配置界面,如下图。在这里可以看到Raid卡的型号和Firmware固件版本,点击【Start】按钮进入Raid卡主页。

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第9张图片

Raid卡首页叫作WebBIOS,如下图。左侧是功能菜单,右侧可以看到所有物理磁盘,本例安装了4块500G硬盘,后面所有的配置都可以在这里完成!

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第10张图片

Raid1配置方法

Raid0的配置过程与Raid1大致相同,唯一不同是在选择Raid级别这一步选择Raid0即可。

在WebBIOS主页点击【Configuration Wizard】,打开配置向导

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第11张图片

选择【Add Configuration】,点击【Next】下一步

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第12张图片

选择【Manual Configuration】,点击【Next】下一步

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第13张图片

左侧方框内可以看到所有未使用的硬盘。因为要做Raid1,我们选择前两块,然后点击下方的【Add to Array】将其加入到右侧方框内。

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第14张图片

点击【Accept DG】即确认创建该磁盘组(Driver Group),Reclaim是指回收即撤回创建的磁盘组,创建磁盘组

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第15张图片

接受了以后,会自动在创建一个磁盘组1,这个可以不用理会。点击【Next】下一步

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第16张图片

点击【Add to SPAN】(这里的SPAN的意思是,在RAID(Redundant Array of Independent Disks)中,Span 是一种磁盘配置方式,它是通过将多个物理磁盘按照顺序连接起来形成一个更大的逻辑磁盘。在Span配置下,数据会逐个磁盘地进行存储,类似于传统的JBOD(Just a Bunch of Disks)配置。与RAID不同,Span不提供数据镜像或数据冗余,而是仅仅通过物理磁盘的叠加来实现存储空间的扩展。Span的存储容量是其所有组成磁盘容量的总和,并且其存取性能与单个磁盘相同。),将刚才创建好的磁盘组加入到右侧方框内

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第17张图片

点击【Next】下一步

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第18张图片

阵列参数配置:第一个参数”Raid Level”选择Raid1,其余保持默认

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第19张图片

最后一个参数”Select Size”输入阵列容量大小,最大值可参考右侧绿字提示(其中R0代表做Raid0最大容量,R1代表做Raid1最大容量),完成后点击【Accept】

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第20张图片

弹出的任何提示均选择【yes】

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第21张图片

回到配置页面,点击【Next】下一步

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第22张图片

点击【Accept】配置完成!

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第23张图片

提示保存,选择【yes】

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第24张图片

(依Raid卡型号不同,有些可能没有此功能,如没有请跳过此步)提示SSD缓存,选择【Cancel】

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第25张图片

提示初始化,选择【yes】

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第26张图片

正在初始化,如果没有上一步,可以在下面这个界面时,选择“Fast Initialize”进行初始化,初始化过程中,能看到左上方百分比进度条(速度较快,可能一闪而过)

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第27张图片

初始化完成!点击【Home】返回首页

(这里的 consistency check,一致性校验。 一致性校验是磁盘阵列控制器的一种高级维护功能。它可以预先检查阵列上的数据,以保证它们的一致性,即数据是正确的、没有被破坏。

  • 检查阵列分布在硬盘上的数据是否一致,保证虚拟磁盘(VD)成员之间的冗余是相同的,便于提前发现问题
  • 对于有奇偶校验值的阵列(RAID-5),一致性校验通过数据的奇偶校验,并且和存校验值的盘上的校验值进行比较,确定并纠正数据的一致性
  • 对于镜像盘,一致性校验比较RAID-1上2块硬盘的数据是否完全一致。不一致的需要进行同步处理。对于剩余空间的磁盘介质consistency check一样会进行读校验

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第28张图片

阵列配置完成!

Raid1状态显示”Optimal”表示正常,Drives显示两块硬盘绿色Online正常,如果还有其它未使用的硬盘,会在unconfigured Drives下面蓝色显示。

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第29张图片

    未使用的硬盘可以继续创建阵列,也可以配置成热备盘

   最后点击【Exit】退出,然后【Ctrl-Alt-Delete】组合键重启服务器!

   上面通过一个例子,来说明创建Raid1 的过程和关键参数。

三、安装windows server 2008 r2过程中出现的与阵列卡相关的问题

     上面重启后,可以看到已经成功创建了raid1,我服务器的实际图见下图:

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第30张图片       此时插入系统启动盘,开始安装windows server 2008 r2操作系统,但当安装到下面一步时,无法找到磁盘:

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第31张图片

      该问题的原因,应该是没有安装SCSI Raid卡驱动。因该设备较早,对应的驱动较为难找,以前在该服务器上安装server 2003时,都是使用软驱,现在软驱找不到了,驱动也随之不见了。于是在网上找了好久,找到下载然后刻录成光盘,在该阶段选择光盘,发现目前网上的几乎都无法使用,见下图:

RS450服务器硬盘亮黄灯故障及从MegaRAID9240-4i阵列卡的恢复业务过程_第32张图片

      最后从原系统中找到该驱动,使用其中的64位版本后,驱动安装成功,能够看到600G的磁盘了。

该阵列卡的驱动链接:Mega Sas 9240-4i or 9260 Raid 卡驱动 for winddows server 2008 r2

       剩下的按照操作系统的安装顺序继续按照就可以了。

感谢观看,有不清楚可以留言。原创不易,转载请注明来源。

你可能感兴趣的:(网络运维,服务器,运维,无法找到磁盘,硬盘亮黄灯的修复)