故障描述:
一台Dell R920的服务器突然宕机,并无法开机,每次按开机后,响应三秒就熄火,往复如此。
服务器有四个电源模块,开始以为是电源模块的故障,遂做了模块的交替和单电源测试,均无效。
要知道服务器在第一次通电或开机的时候有个加电自检的过程,这个过程一般都会伴随着强大的噪音,本次的故障就发生在这个过程中,给人第一观感就是服务器供不上电,响动几秒就熄火了,且前面板信息显示屏也是不亮的。
基本排除电源模块的故障,那么是不是电压不稳造成的?让机房电工逐一排查了电路,电流和电压均在正常值范围。
有没有可能是cpu、内存的故障导致如法自检,但基本排除,因为这个还没有到自检的那一步,显示器无任何输出。
而主板的故障倒是有可能,dell售后也给出了做“硬件最小化测试”的建议,事实上这也是通过自检来判断故障。
既然无法从外部直接判断故障根源,那么从内部呢,无法开机,自然无法通过系统抓取详细的日志。
所幸,此时它的IDRAC管理口依然可以用,通过网页管理生成一个维修报告,但很遗憾,并没有实质性的内容。
仅有几条多次开机、关机的报错日志,这个是之前做电源测试反复开关机生成的,而且故障出现之前,并没有内存、cpu、硬盘等常见硬件的报错日志。
究竟是什么造成的呢?
这里又做了一个测试,把开机按钮面板的线缆拔掉后再瞬间接触下,奇迹发生了,服务器在一阵轰鸣中正常启动了。
没错,故障的根源就是服务器的开关机按钮面板的模块出现短路故障,也就是每当你按下开机按钮时,因短路又再次触发了关机的指令,更无法给整个主板供电,因此前面板信息显示屏也不亮,更谈不上给整个服务器供电开机了。
知道根源,解决就很简单,直接联系Dell售后更换即可。
(今天的分享就到这里,如果您有高见或好的分享,记得留言哦!)