Linux+Docker+Kubernetes磁盘清理
Linux+Docker+Kubernetes磁盘清理
-
起因:K8S测试环境的某个Deployment容器日志输出连接不上mongodb
-
找到自建mongodb是和Jenkins放在同一台服务器上, 查看日志是26号下午停止的,然后重启失败了
-
通过mongo日志发现是因为昨天下午测试环境的Jenkins批量构建,导致images镜像数量突增,磁盘空间不足导致mongodb挂掉的
-
计划: 一、把镜像清理的间隔缩小成一个小时一次;二、确保磁盘空间充足
* */1 * * * /bin/docker rmi `docker images -q -f dangling=true`
一、Linux清理
-
查看磁盘全部空间
$ df -hl Filesystem Size Used Avail Use% Mounted on /dev/sda2 100G 47G 54G 47% /
-
查看指定目录占用
$ du -sh /data 3.5G /data
-
删除指定前缀的文件夹
$ cd /nfsdata $ ls | grep archived- |xargs -L1 rm -r
-
寻找当前目录,哪个文件夹占用空间最大
du -h --max-depth=1
-
将当前目录下的文件以大到小顺序展现
ls -lhS
-
清理文件(优于 rm -f)
echo '' > catalina.out
-
清理僵尸进程
$ ps -A -ostat,ppid | grep -e '^[Zz]' | awk '{print }' | xargs kill -HUP > /dev/null 2>&1
二、Docker清理
-
查看磁盘使用情况
$ docker system df TYPE TOTAL ACTIVE SIZE RECLAIMABLE Images 17 3 1.796GB 1.374GB (76%) Containers 3 3 135B 0B (0%) Local Volumes 41 0 1.683GB 1.683GB (100%) Build Cache 0 0 0B 0B
-
清理 none 镜像
$ docker images | grep none | awk '{print $3}' | xargs docker rmi -f
-
清理不再使用的数据卷
docker volume rm $(docker volume ls -q) 或者 $ docker volume prune
-
清理缓存
$ docker builder prune
-
全面清理——删除关闭的容器、无用的存储卷、无用的网络、dangling 镜像(无 tag 镜像)
$ docker system prune -f
$ docker system prune -a
删除容器:docker container rm `docker container ls -a -q` 删除镜像:docker image rm `docker image ls -a -q` 删除数据卷:docker volume rm `docker volume ls -q` 删除network:docker network rm `docker network ls -q`
二、Kubernetes清理
-
清理 Evicted 状态的 Pod
$ kubectl get pods --all-namespaces -o wide | grep Evicted | awk '{print $1,$2}' | xargs -L1 kubectl delete pod -n
-
清理 Error 状态的 Pod
$ kubectl get pods --all-namespaces -o wide | grep Error | awk '{print $1,$2}' | xargs -L1 kubectl delete pod -n
-
清理 Completed 状态的 Pod
$ kubectl get pods --all-namespaces -o wide | grep Completed | awk '{print $1,$2}' | xargs -L1 kubectl delete pod -n
-
清理没有被使用的 PV
$ kubectl describe -A pvc | grep -E "^Name:.*$|^Namespace:.*$|^Used By:.*$" | grep -B 2 "<none>" | grep -E "^Name:.*$|^Namespace:.*$" | cut -f2 -d: | paste -d " " - - | xargs -n2 bash -c 'kubectl -n ${1} delete pvc ${0}'
-
清理没有被绑定的 PVC
$ kubectl get pvc --all-namespaces | tail -n +2 | grep -v Bound | awk '{print $1,$2}' | xargs -L1 kubectl delete pvc -n
-
清理没有被绑定的 PV
$ kubectl get pv | tail -n +2 | grep -v Bound | awk '{print $1}' | xargs -L1 kubectl delete pv