K8S问题排查流程

K8S问题排查流程如下:
kubectl get pod --all-namespaces | grep -v Running
kubectl describe pod <error_pods> -n <namespace>
kubectl logs <error_pods> -n <namespace>
kubectl logs <error_pods> -n <namespace> -p (查看该pod重启之前的日志)
kubectl get event
查看k8s组件日志
kubectl logs -n kube-system kube-apiserver-XXX
kubectl logs -n kube-system kube-scheduler-XXX
kubectl logs -n kube-system kube-controller-manager-XXX
journalctl -xeu etcd
journalctl -xeu kubelet
查看component、engine、biz层组件日志
kubectl logs -n [component|default]  [pod_name]
查看kong ingress日志
kubectl logs -n ingress ingress-kong-openapi-XXX
查看docker、license-ca日志
journalctl -xeu docker
journalctl -xeu license-ca 
查看操作系统日志
less /var/log/message
less /var/log/dmesg
dmesg -T| egrep -i "error|warn|fatal|fail |failed|oom|offline|down"
查看机器硬件配置
lscpu
lsmem
lspci| grep Ethernet
dmidecode
查看操作系统挂载情况
对比 df -h | egrep "^/dev" | awk '{print $NF}' | sort 与  egrep -v "^$|^#" /etc/fstab | awk '{print $2}'| sort 命令的结果
lsblk
查看操作系统性能情况
htop
dstat 1
iotop -o
iostat -x 1
mpstat
vmstat
通过IPMI查看硬件配置情况
ipmitool sel list

posted @ 2021-12-01 14:03  IT界的一名小婊渣  阅读(406)  评论(0编辑  收藏  举报