PXE刷机,存储节点失败
最近刚刚帮客户对一台满配的X6-2刷机初始化,尝试了下PXE方式,但刷完机后,发现计算节点的imagehistory输出的状态都是成功的,而所有的存储节点状态都为failure,具体如下:
[root@dm01celadm01 ~]# imagehistory Version : 12.2.1.1.5.171218.1 Image activation date : 2018-03-07 20:25:33 +0800 Imaging mode : fresh Imaging status : failure |
查看存储节点最后一次启动过程中的日志输出,发现了如下内容:
Logging started to /var/log/cellos/validations.log Command line is /opt/oracle.cellos/validations/bin/vldrun.pl -quiet -all Run validation ipmisettings - PASSED Run validation misceachboot - PASSED Run validation celldstatus - PASSED Run validation biosbootorder - PASSED Run validation oswatcher - PASSED Run validation checkconfigs - FAILED Check log in /var/log/cellos/validations/checkconfigs.log Run validation saveconfig - BACKGROUND RUN |
可以看出,在系统的启动过程中执行checkconfigs的校验时失败,具体原因需要去查看/var/log/cellos/validations/checkconfigs.log日志。
查看checkconfigs.log日志内容,发现了如下错误信息:
[1520425328][2018-03-07 20:25:22 +0800][INFO][0-0][/opt/oracle.cellos/validations/init.d/checkconfigs][check_configs][] ====Potential Alert==== [1520425328][2018-03-07 20:25:22 +0800][FILE][/opt/oracle.cellos/validations/init.d/checkconfigs][check_configs][] [FILE: /var/log/cellos/_CheckCfg_gfCkcehC_] Verify network configuration: ipconf -check-consistency -semantic-min -ignore-get-ilom-errors [Info]: ipconf command line: /opt/oracle.cellos/ipconf.pl -check-consistency -semantic-min -ignore-get-ilom-errors -nocodes Logging started to /var/log/cellos/ipconf.log [Info]: Verify that the configured values in the Exadata configuration file /opt/oracle.cellos/cell.conf agree with the actual values in use on this system At least one NTP server must be reachable : FAILED Loading basic configuration settings from ILOM ... [Warning]: ILOM DNS server(s) could not be retrieved [Info]: Consistency check FAILED [INFO] The ipconf consistency check fails. [INFO] As root user run ipconf -check-consistency -semantic-min -ignore-get-ilom-errors to verify consistent network configurations. |
可以看出,系统启动过程中会执行/opt/oracle.cellos/ipconf.pl -check-consistency -semantic-min -ignore-get-ilom-errors -nocodes来校验当前的网络环境,校验时发现NTP服务器不通,所以checkconfigs失败。
为什么NTP服务器不通?原因很简单,因为我PXE刷机之前,已经将思科交换机连接到客户管理网交换机上网线拔掉了。之所以在PXE刷机之前拔掉网线,是因为PXE主机也是一台DHCP服务器,对客户的网络环境不熟悉的情况下,如果冒然对现有的环境中接入一台DHCP服务器,后果可能会很严重。其实刷机之前断开Exadata与外界的网络连接,也是官方的推荐做法。
既然知道原因,那这个问题处理就相当简单了,PXE刷完机后,关闭PXE环境,重新将Exadata与外界互联,并重启一次存储节点,一切都恢复正常,imagehistory中的状态会变回success.
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· DeepSeek在M芯片Mac上本地化部署
2017-03-08 Exadata Smart Flash Logging工作原理