virtual

导航

k8s命令

k8s关键命令

集群详细信息:

  1. 显示 Kubernetes 版本: kubectl version

  2. 显示集群信息: kubectl cluster-info

  3. 列出集群中的所有节点: kubectl get nodes

  4. 查看一个具体的节点详情: kubectl describe node srenode

  5. 列出所有命名空间: kubectl get namespaces

  6. 列出所有命名空间中的所有 pod: kubectl get pods --all-namespaces

Pod 故障诊断:

  1. 列出特定命名空间中的 pod: kubectl get pods -n srens

  2. 查看一个 Pod 详情: kubectl describe pod srepod -n srens

  3. 查看 Pod 日志: kubectl logs srepod -n srens

  4. 尾部 Pod 日志: kubectl logs -f srepod -n srens

  5. 在 pod 中执行命令: kubectl exec -it srepod -n srens -- 《command》

Pod 健康检查报告:

  1. 检查 Pod 准备情况: kubectl get pods srepod -n srens -o jsonpath='{.status.conditions[?(@.type=="Ready")].status}'

  2. 检查 Pod 事件: kubectl get events -n srens --field-selector involvedObject.name=srepod

Service健康诊断:

  1. 列出命名空间中的所有服务: kubectl get svc -n srens

  2. 查看一个服务详情: kubectl describe svc sreservice -n srens

Deployment健康诊断:

  1. 列出命名空间中的所有Deployment: kubectl get deployments -n srens

  2. 查看一个Deployment健康详情: kubectl describe deployment sredeployment -n srens

  3. 查看滚动发布状态: kubectl rollout status deployment/sredeployment -n srens

  4. 查看滚动发布历史记录: kubectl rollout history deployment/sredeployment -n srens

StatefulSet健康诊断:

  1. 列出命名空间中的所有 StatefulSet: kubectl get statefulsets -n srens

  2. 查看一个 StatefulSet详情: kubectl describe statefulset srestatefulset -n srens

ConfigMap 和Secret健康诊断:

  1. 列出命名空间中的 ConfigMap: kubectl get configmaps -n srens

  2. 查看一个ConfigMap详情: kubectl describe configmap 《configmap-name》 -n srens

  3. 列出命名空间中的 Secret: kubectl get secrets -n srens

  4. 查看一个Secret详情: kubectl describe secret sre-secret -n srens

命名空间诊断信息:

  1. 查看一个命名空间详情: kubectl describe namespace srens

资源使用情况信息:

  1. 检查 pod 的资源使用情况: kubectl top pod srepod -n srens

  2. 检查节点资源使用情况: kubectl top nodes

网络诊断信息:

  1. 显示命名空间中 Pod 的 IP 地址: kubectl get pods -n srens -o custom-columns=POD:metadata.name,IP:status.podIP --no-headers

  2. 列出命名空间中的所有网络策略: kubectl get networkpolicies -n srens

  3. 查看一个网络策略详情: kubectl describe networkpolicy 《network-policy-name》 -n srens

持久卷 (PV) 和持久卷声明 (PVC) 诊断:

  1. 列出PV: kubectl get pv

  2. 查看一个PV详情: kubectl describe pv 《pv-name》

  3. 列出命名空间中的 PVC: kubectl get pvc -n srens

  4. 查看PVC详情: kubectl describe pvc 《pvc-name》 -n srens

节点诊断信息:

  1. 获取特定节点上运行的 Pod 列表: kubectl get pods --field-selector spec.nodeName=srenode -n srens

资源配额和限制信息:

  1. 列出命名空间中的资源配额: kubectl get resourcequotas -n srens

  2. 查看一个资源配额详情: kubectl describe resourcequota 《resource-quota-name》 -n srens

自定义资源定义 (CRD) 诊断信息:

  1. 列出命名空间中的自定义资源: kubectl get 《custom-resource-name》 -n srens

  2. 查看自定义资源详情: kubectl describe 《custom-resource-name》 《custom-resource-instance-name》 -n srens

使用这些命令时,请记住将srens, srepod, sreservice, sredeployment, srestatefulset, 《configmap-name》, sre-secret, srens, 《pv-name》, 《pvc-name》, srenode, 《network-policy-name》, 《resource-quota-name》, 《custom-resource-name》, 和替换为你的特定值。

《custom-resource-instance-name》这些命令应该可以帮助你诊断 Kubernetes 集群以及在其中运行的应用程序。

资源伸缩和自动伸缩

  1. Deployment伸缩信息: kubectl scale deployment sredeployment --replicas=《replica-count》 -n srens

  2. 设置Deployment的自动伸缩: kubectl autoscale deployment sredeployment --min=《min-pods》 --max=《max-pods》 --cpu-percent=《cpu-percent》 -n srens

  3. 检查水平伸缩器状态信息: kubectl get hpa -n srens

作业和 CronJob 诊断:

  1. 列出命名空间中的所有作业: kubectl get jobs -n srens

  2. 查看一份工作详情: kubectl describe job sre-job -n srens

  3. 列出命名空间中的所有 cron 作业: kubectl get cronjobs -n srens

  4. 查看一个 cron 作业详情: kubectl describe cronjob 《cronjob-name》 -n srens

容量诊断信息:

  1. 列出按容量排序的持久卷 (PV): kubectl get pv --sort-by=.spec.capacity.storage

  2. 查看PV回收策略: kubectl get pv 《pv-name》 -o=jsonpath='{.spec.persistentVolumeReclaimPolicy}'

  3. 列出所有存储类别: kubectl get storageclasses

Ingress和服务网格诊断信息:

  1. 列出命名空间中的所有Ingress: kubectl get ingress -n srens

  2. 查看一个Ingress详情: kubectl describe ingress 《ingress-name》 -n srens

  3. 列出命名空间中的所有 VirtualServices (Istio): kubectl get virtualservices -n srens

  4. 查看一个 VirtualService (Istio)详情: kubectl describe virtualservice 《virtualservice-name》 -n srens

Pod 网络故障排除信息:

  1. 运行网络诊断 Pod(例如 busybox)进行调试: kubectl run -it --rm --restart=Never --image=busybox net-debug-pod -- /bin/sh

  2. 测试从 Pod 到特定端点的连接: kubectl exec -it srepod -n srens -- curl 《endpoint-url》

  3. 跟踪从一个 Pod 到另一个 Pod 的网络路径: kubectl exec -it 《source-pod-name》 -n srens -- traceroute 《destination-pod-ip》

  4. 检查 Pod 的 DNS 解析: kubectl exec -it srepod -n srens -- nslookup 《domain-name》

配置和资源验证信息:

  1. 验证 Kubernetes YAML 文件而不应用它: kubectl apply --dry-run=client -f 《yaml-file》

  2. 验证 pod 的安全上下文和功能: kubectl auth can-i list pods --as=system:serviceaccount:srens:《serviceaccount-name》

RBAC 和安全性信息:

  1. 列出命名空间中的角色和角色绑定: kubectl get roles,rolebindings -n srens

  2. 查看角色或角色绑定详情: kubectl describe role 《role-name》 -n srens

服务帐户诊断信息:

  1. 列出命名空间中的服务帐户: kubectl get serviceaccounts -n srens

  2. 查看一个服务帐户详情: kubectl describe serviceaccount 《serviceaccount-name》 -n srens

清空节点和解除封锁信息:

  1. 清空节点以进行维护: kubectl drain srenode --ignore-daemonsets

  2. 解除对节点的封锁: kubectl uncordon srenode

资源清理信息:

  1. 强制删除 pod(不推荐): kubectl delete pod srepod -n srens --grace-period=0 --force

Pod 亲和性和反亲和性信息:

  1. 列出 pod 的 pod 亲和性规则: kubectl get pod srepod -n srens -o=jsonpath='{.spec.affinity}'

  2. 列出 pod 的 pod 反亲和性规则: kubectl get pod srepod -n srens -o=jsonpath='{.spec.affinity.podAntiAffinity}'

Pod 安全策略 (PSP):

  1. 列出所有 Pod 安全策略(如果启用): kubectl get psp

事件:

  1. 查看最近的集群事件: kubectl get events --sort-by=.metadata.creationTimestamp

  2. 按特定命名空间过滤事件: kubectl get events -n srens

节点故障排除:

  1. 检查节点情况: kubectl describe node srenode | grep Conditions -A5

  2. 列出节点容量和可分配资源: kubectl describe node srenode | grep -E "Capacity|Allocatable"

临时容器(Kubernetes 1.18+):

  1. 运行临时调试容器: kubectl debug -it srepod -n srens --image=《debug-image》 -- /bin/sh

资源指标(需要指标服务器):

  1. 获取 Pod 的 CPU 和内存使用情况: kubectl top pod -n srens

kuelet诊断:

  1. 查看节点上的kubelet日志: kubectl logs -n kube-system kubelet-srenode

使用Telepresence 进行高级调试:

  1. 使用 Telepresence 调试 pod: telepresence --namespace srens --swap-deployment srepod

Kubeconfig 和上下文:

  1. 列出可用的上下文: kubectl config get-contexts

  2. 切换到不同的上下文: kubectl config use-context 《context-name》

Pod 安全标准(PodSecurity 准入控制器):

  1. 列出 PodSecurityPolicy (PSP) 违规行为: kubectl get psp -A | grep -vE 'NAME|REVIEWED'

Pod 中断预算 (PDB) 诊断:

  1. 列出命名空间中的所有 PDB: kubectl get pdb -n srens

  2. 查看一个PDB详情: kubectl describe pdb 《pdb-name》 -n srens

资源锁诊断(如果使用资源锁):

  1. 列出命名空间中的资源锁: kubectl get resourcelocks -n srens

服务端点和 DNS:

  1. 列出服务的服务端点: kubectl get endpoints sreservice -n srens

  2. 检查 Pod 中的 DNS 配置: kubectl exec -it srepod -n srens -- cat /etc/resolv.conf

自定义指标(Prometheus、Grafana):

  1. 查询Prometheus指标: 用于kubectl port-forward访问Prometheus和Grafana服务来查询自定义指标。

Pod 优先级和抢占:

  1. 列出优先级: kubectl get priorityclasses

Pod 开销(Kubernetes 1.18+):

  1. 列出 pod 中的开销: kubectl get pod srepod -n srens -o=jsonpath='{.spec.overhead}'

存储卷快照诊断(如果使用存储卷快照):

  1. 列出存储卷快照: kubectl get volumesnapshot -n srens

  2. 查看存储卷快照详情: kubectl describe volumesnapshot 《snapshot-name》 -n srens

资源反序列化诊断:

  1. 反序列化并打印 Kubernetes 资源: kubectl get 《resource-type》 《resource-name》 -n srens -o=json

节点污点:

  1. 列出节点污点: kubectl describe node srenode | grep Taints

更改和验证 Webhook 配置:

  1. 列出变异 webhook 配置: kubectl get mutatingwebhookconfigurations

  2. 列出验证 Webhook 配置: kubectl get validatingwebhookconfigurations

Pod 网络策略:

  1. 列出命名空间中的 pod 网络策略: kubectl get networkpolicies -n srens

节点条件(Kubernetes 1.17+):

  1. 自定义查询输出: kubectl get nodes -o custom-columns=NODE:.metadata.name,READY:.status.conditions[?(@.type=="Ready")].status -l 'node-role.kubernetes.io/worker='

审核日志:

  1. 检索审核日志(如果启用): 检查 Kubernetes 审核日志配置以了解审核日志的位置。

节点操作系统详细信息:

  1. 获取节点的操作系统信息: kubectl get node srenode -o jsonpath='{.status.nodeInfo.osImage}'

这些命令应该涵盖 Kubernetes 中的各种诊断场景。确保将srens、srepod、sredeployment等占位符替换为你的集群和用例的实际值。

posted on 2024-08-11 10:42  virtualwxg  阅读(9)  评论(0编辑  收藏  举报