服务器常见的十四个故障及解决方法(2)
七、为什么用正确的驱动仍然无法加载硬盘控制器驱动?
查看是否启用了hostraid功能。
八、新购买的一块硬盘,安装到机器上之后,机器自检无法通过?
将新的硬盘取下,机器是否可以自检通过;
检查新增加的硬盘的ID号是否与原来的硬盘的ID号相同,如果硬盘的ID号相同的话,自检将无法通过。
九、如何格式化SCSI硬盘?
有操作系统的情况:使用磁盘管理工具格式化;
无操作系统的情况:在SCSI管理控制界面格式化;
以ADAPTEC Raid卡为例:开机-出现CTRL+A 信息时,按CTRL+A进 入-选中通道A
-选中SCSI UTILITY-将检测到硬盘-选中要检测的硬盘
-选中FORMAT可对硬盘进行全面格式化
选中VERIFY可对硬盘进行检测,检查是否有坏道
注意:在格式化硬盘时不能中断或停电,不然会损坏磁盘
十、在Aisino 系列中有RAID卡机器,当其中一个硬盘不能正常工作RAID报警,但系统能正常运行,怎么办?
用一个新硬盘,确保容量大于或等于不能正常工作的硬盘,最好用相同型号的硬盘替换即可。
RAID卡相关常见故障
第一类: RAID卡本身有问题
经常表现为RAID信息丢失,硬盘经常掉线,不能做REBUILD,开机自检时检测不到硬盘或时间长。
典型故障A:
作完RAID1,安装操作系统,一切正常,但第二次重启系统时,发出报警声,经检查发现一块硬盘掉线,REBUILD后,又恢复正常,但重启后又掉线。怀疑为硬盘故障,校验硬盘后均无问题。最后更换RAID卡,故障解决。
典型故障B:
机器经常死机,且有时候启动速度非常慢。观察系统日志,发现在系统启动时有这样一个错误提示:设备/devices/scsi/port0 在传输等待的时间内没有响应。更换RAID卡后,恢复正常。
第二类: 硬盘本身问题
表现为硬盘掉线,在RAID阵列中的状态为DEAD,或者在作REBUILD时,作到某一进度就不能继续
典型故障:
硬盘掉线后,做REBUILD时,作到20%时出现错误提示无法继续进行。在确认掉线硬盘,硬盘盒及SCSI电缆都能正常工作后,对在线硬盘进行校验,发现有坏道,修复硬盘,重做REBUILD,恢复正常。
第三类: 硬盘盒或模组的接触问题
此类问题经常表现为RAID卡根本检测不到硬盘,此类问题比较简单,但在处理硬盘盒相关机器时,需要注意一些问题。
典型故障:
RIAD卡中检测不到硬盘,把SCSI电缆接到主板的ULTRA160接口上,故障依旧,拔出硬盘盒(不包括硬盘盒后面的托架)更换,故障依旧,更换硬盘,还是不行。最后卸下硬盘盒后面的托架(非热插拔部分),发现后托架上80PIN接口上的一根针弯曲,校直弯针,恢复正常。
十一、在服务器上使用的SCSI硬盘,为什么硬盘的ID号不能设置为7?
SCSI控制器中,默认将ID=7设置为硬盘控制器占,所以硬盘的ID号不能设置为7
十二、为什么开机自检无法通过?
解决方法:
机器切断电源,将机箱打开,用“COMS CLEAR”跳线的跳线帽将“COMS CLEAR”跳线的另外两个针短接(跳线参看主板说明书)
机器加电,自检,等机器自检完闭,报CMOS已被清除,然后将机器电源关掉,把跳线复原即可
机器重新开机
十三、物理内存插槽报错
解决方法:
开机-按F2进入“SETUP”-“ADVANCED”--“MEMORY CONFIGURATION” 回车-“CLEAR DIMM ERRORS” 直接回车
十四、为什么处理器报错或自检过程中只找到一个处理器?
解决方法:
开机--〉按F2键,进入"SETUP"
1、依次"MAIN" --〉"PROCESSOR" --〉"CLEAR PROCESSOR ERRORS [ ]" :将此选项值设置为"YES" ;
2、依次"ADVANCED " --〉"RESET CONFIGURATION DATA [ ] ":将此选项的值设置为" YES" ;
3、依次"SERVER " --〉"PROCESSOR RESET [ ] ":将此选项的值设置为" YES" ;
4、依次"SERVER " --〉"SYSTEM MANAGEMENT ":回车 --〉 "CLEAR EVENTLOG [ ] " :将此选项 的值设置为" YES"
5、按F10,保存退出