随笔分类 - 运维手册
摘要:这是因为kubelet的cgroup和docker的不一致所导致的,“kubelet cgroup驱动为systemd,而docker的为cgroupfs”,有两种决解决方式,方式一:修改docker的cgroup为systemd 修改docker服务的配置文件,“/etc/docker/daemo
阅读全文
摘要:k8s集群在扩容的是某个节点出现 Error querying BIRD: unable to connect to BIRDv4 socket 1、问题背景: 原因是因为新扩容的机器在扩容之前安装过docker切和当前的版本相差较大: 在k8s扩容的时候扩容完发现calico异常,describe
阅读全文
摘要:于是describe查看宿主机的事件信息 查看日志没有相关日志 查看calico的相关配置文件值找到 于是想着直接去修改calico的Configmap发现修改不成功 便去查询宿主机映射的calico挂载文件把标记部分的string给成int去掉双引号,然后重启calico 然后通过ansible分
阅读全文
摘要:安装GPU驱动之前建议升级内核,这里踩坑了 !!! 英伟达驱动官网下载链接:https://www.nvidia.cn/Download/index.aspx?lang=cn 安装gpu驱动 安装相关依赖,需安装kernel-header yum install kernel-devel gcc -
阅读全文
摘要:删除 k8s 资源 kubectl -n kube-system delete deploy calico-kube-controllers kubectl -n kube-system delete ds calico-node kubectl -n kube-system delete cm c
阅读全文
摘要:在安装harbor发现docker的network已经存在了 然后直径ls去查看发现存在如下,然后去rm删除的时候发现删不掉 [root@st-test-hemu-harbor-2 harbor]<20230529 11:37:11># docker network ls NETWORK ID NA
阅读全文
摘要:最开始是镜像拉取策略是Never 原因是因为我这个是公网镜像仓库,犹豫机器的不稳定域名解析有问题 其实本地是由这个镜像的 所以只要把这里的镜像策略更改就可以了 对应的拉取策略参考镜像拉取策略
阅读全文
摘要:Linux 免密登录设置 一、生成公私钥 1.1 ssh-keygen -t rsa #生成免密登录公私钥,根据提示按回车或y 1.2 ls -lha #.ssh目录默认隐藏,可使用ls -lha 查看 1.3 cd /root/.ssh/ #进入.ssh 公私钥存放目录 1.4 ll #查看目录文
阅读全文
摘要:kubernetes集群节点多网卡,calico/flannel组件如何指定网卡 1、calico如果有节点是多网卡,所以需要在deploy的env指定内网网卡 spec: containers: - env: - name: IP value: "autodetect" - name: IP_AU
阅读全文
摘要:umount /home/data1/ 卸载分区目录,出现target is busy umount /home/data1/ umount: /home/data1: target is busy. (In some cases useful info about processes that u
阅读全文
摘要:报错如下: 解决办法: 在进行pvcreate创建PV时,可能会遇到Device /dev/sdX excluded by a filter报错,一般出现这个错误是在通过parted分区并删除相应的分区信息以后。遇到这种情况有两种解决方法: wipefs -a /dev/vdb # pvcreate
阅读全文
摘要:K8S的pod展示镜像信息 https://kubernetes.io/zh/docs/tasks/access-application-cluster/list-all-running-container-images/ kubectl get pods -o jsonpath='{range .
阅读全文
摘要:打开终端输入命令比如mkdir 、cd等等,会出现如下提示 cannot create temp file for here-document: Read-only file system 解决办法如下: mount -o remount,rw / 原文:https://www.codenong.c
阅读全文
摘要:原因,有可能机器的cpu信息有变化(扩容或者缩容)解决办法: 删掉/opt/var/lib/kubelet目录下(或者/data/lib/kubelet)cpu_manager_state文件 然后monit restart kubelet(或者systemctl restart kubelet)
阅读全文
摘要:其他无用的网卡配置信息mv走重启network如果还是不行重启一下服务器问题就能解决
阅读全文
摘要:k8s运维之pod排错 K8S是一个开源的,用于管理云平台中多个主机上的容器化应用,Kubernetes的目标是让部署容器化变得简单并且高效 K8S的核心优势: 1,基于yaml文件实现容器的自动创建、删除 2,更快速实现业务的弹性横向扩容 3,动态发现新扩容的容器并自动对用户提供访问 4,更简单、
阅读全文
摘要:https://pkgs.org/ https://blog.csdn.net/yang_z_1/article/details/123797954 https://mirrors.tuna.tsinghua.edu.cn/elrepo/kernel/el7/x86_64/RPMS/
阅读全文
摘要:编辑yaml去掉健康检查 kubectl edit deployment deploymentname 服务恢复
阅读全文
摘要:linux系统跟windows系统都是操作系统的一种,安装的方法也较多,一样可以通过制作u盘启动盘给linux系统安装.那么具体是如何安装linux?下面就给大家演示下u盘启动盘安装linux系统教程. 步骤一:U盘制作Linux安装盘 1.首先准备好大于的8G U盘一个,因为现在的镜像基本上都有3
阅读全文