好久不来园子,也好久没处理过WAS问题了,今天客户想部署应用,发现Dmgr无法访问,去重启,无法正常启动。直接上日志:
[24-6-12 3:00:55:025 CST] 00000009 MultiScopeRec A CWRLS0008E: 正在将恢复日志标记为“失败”。[ 1 transaction ]
[24-6-12 3:00:55:026 CST] 00000009 MultiScopeRec I CWRLS0009E: 恢复日志故障的详细信息:com.ibm.ws.recoverylog.spi.LogCorruptedException
at com.ibm.ws.recoverylog.spi.LogHandle.openLog(LogHandle.java:302)
at com.ibm.ws.recoverylog.spi.MultiScopeRecoveryLog.openLog(MultiScopeRecoveryLog.java:585)
at com.ibm.ws.recoverylog.spi.RecoveryLogImpl.openLog(RecoveryLogImpl.java:73)
at com.ibm.tx.jta.impl.RecoveryManager.run(RecoveryManager.java:1895)
at java.lang.Thread.run(Thread.java:790)
[24-6-12 3:00:55:822 CST] 00000000 WsServerImpl E WSVR0009E: 启动期间发生错误
com.ibm.ws.exception.RuntimeError: com.ibm.ws.recoverylog.spi.LogCorruptedException
at com.ibm.ws.tx.util.WASTMHelper.asynchRecoveryProcessingComplete(WASTMHelper.java:176)
at com.ibm.tx.util.TMHelper.asynchRecoveryProcessingComplete(TMHelper.java:57)
at com.ibm.tx.jta.impl.RecoveryManager.recoveryFailed(RecoveryManager.java:1421)
at com.ibm.tx.jta.impl.RecoveryManager.run(RecoveryManager.java:1951)
at java.lang.Thread.run(Thread.java:790)
Caused by: com.ibm.ws.recoverylog.spi.LogCorruptedException
at com.ibm.ws.recoverylog.spi.LogHandle.openLog(LogHandle.java:302)
at com.ibm.ws.recoverylog.spi.MultiScopeRecoveryLog.openLog(MultiScopeRecoveryLog.java:585)
at com.ibm.ws.recoverylog.spi.RecoveryLogImpl.openLog(RecoveryLogImpl.java:73)
at com.ibm.tx.jta.impl.RecoveryManager.run(RecoveryManager.java:1895)
... 1 more
[24-6-12 3:00:57:630 CST] 0000000b WSChannelFram A CHFW0019I: 传输通道服务已启动了链 chain_0。
[24-6-12 3:01:00:851 CST] 00000000 AppProfileCom I ACIN0009I: 正在停止 Application Profiling 服务。
[24-6-12 3:01:00:852 CST] 00000000 ActivitySessi I WACS0049I: ActivitySession 服务正在停止。
[24-6-12 3:01:00:856 CST] 00000000 ObjectPoolSer I OBPL0011I: 正在停止 Object Pool 服务。
[24-6-12 3:01:00:857 CST] 00000000 AuditServiceI A SECJ6004I: 安全性审计是禁用的。
[24-6-12 3:01:00:858 CST] 00000000 distSecurityC I securityServiceStarted is false
[24-6-12 3:01:00:875 CST] 00000000 CGBridgeServi I CWRCB0103I: 核心组网桥服务已停止。
[24-6-12 3:01:00:877 CST] 00000000 DragDropDeplo I CWLDD0004I: 正在停止受监控的目录应用程序部署服务...
[24-6-12 3:01:00:877 CST] 00000000 DragDropDeplo I CWLDD0005I: 受监控的目录应用程序部署服务已停止。
[24-6-12 3:01:00:879 CST] 00000000 DCSStackImpl I DCSV8011I: 在成员 APP1Cell01\APP1CellManager01\dmgr 处的 DCS 堆栈 DefaultCoreGroup:成员接收到关闭请求。
[24-6-12 3:01:00:912 CST] 00000000 TCPChannel I TCPC0002I: TCP 通道 TCPInboundChannel_ipcc.Default_IPC_Connector_Name 已停止侦听主机 localhost.localdomain (IPv4: 127.0.0.1) 端口 9632。
[24-6-12 3:01:00:920 CST] 00000000 FailureScopeC A WTRN0105I: 事务服务已成功关闭,没有任何事务需要进行恢复。
[24-6-12 3:01:00:922 CST] 00000000 TCPChannel I TCPC0002I: TCP 通道 TCP_5 已停止侦听主机 * (IPv6) 端口 9352。
针对CWRLS0009E问题:
此问题是由install_root/profiles/proile_name/tranlog/cell_name/node_name/server_name/transaction/partnerlog和tranlog目录中的伙伴日志和事务日志文件损坏引起的。
解决方法:您可以通过(一定要备份)删除tranlog和partnerlog目录中的文件来恢复来恢复问题。
从生产环境中删除这些文件之前要格外小心,这一点非常重要,因为在服务器出现故障后,这些日志中的信息被用来完成准备好的事务,这可能会导致关键任务数据的丢失。