Memory Error
不久前,为了满足工作中日常的各种实验测试需求,终于按需求组装一台塔式的server T440。但是没有多久就出现些问题,以下大概是问题和现象简单描述:
(1). 最开始时,没几天就出现自动重启的问题,当时也正好做了一个比较消耗资源的大集群的实验,当时初步判断可能是内存资源不够(实际按监控来看,并没使用多少,而且也没真正跑应用),就没太理会。
(2). 没过几天,竟然发现在简单跑一台虚拟机的情况下,还是出现自动重启,但是还是没触发底线,感觉还能用,就此算了,直到一天,直出现问题了,重启后,直起不来。
(3). 出现问题时,大概有两个现象:A. 服务器的一些灯都从原先的蓝色变成黄色警告 B. 屏幕上报了内存错误 通过Output大概知道问题,但是由于自己对这方面不太熟悉,第一时间还是和售后联系。
售后给出的建议是内存有问题,打开机箱重新拨插下。过程中做以下操作修复问题:
- 操作1:按照指引打开精巧的设计的server机箱,找到报错A4槽位的的内存条,重新拨插后,还是不行,而且把它拨掉进行重启,却一直卡在BIOS驱动加载,重新插回去又回到内存报错的界面。暂时判断A4的内存条出现问题。
- 操作2:按照指引关机后,拨掉电源,按住电源开关銉30秒后,再进行重启,还是无果。
- 操作3:现在8根内存A1~A8槽位,把A2-A8都拨掉,进行启动,发现可行,然后再把A2-A4的插上,这时也可以启动,再次把A5-A7的都补上,发现也正常,为了再次验证A4内存条是否正常,再次尝试插到A8的位置上进行启动,最后,竟然启动起来了,问题解决了。
小结:操作过后,一段时间也在保持服务器的运行,暂时没发现有重启的现象,有可能组装时A4上插得不太好。