摘要: 一、K8S集群架构说明 二、K8S集群主机配置 2.1 主机操作系统说明 序号 操作系统及版本 备注 1 CentOS7u9 2.2 主机软、硬件配置说明 需求 CPU 内存 硬盘 角色 主机名 软件 值 8C 8G 1024GB HA ha1 haproxy、keepalived 值 8C 8G 阅读全文
posted @ 2024-08-20 16:18 broadviews 阅读(333) 评论(0) 推荐(0) 编辑
摘要: 安装NVIDIA Driver 进入英伟达官网下载页面 按照以上方式选择即可得到>535.113.01版本的驱动,可以实现多卡推理,小于这个版本会导致多卡训练以及推理报错 虽然最新版本为550.54.15,但是535版本更加稳定,并且pytorch目前只支持到12.1,而在CUDA Toolkit选 阅读全文
posted @ 2024-12-26 14:34 broadviews 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 新增节点的步骤 将其他节点的server.properties配置文件拷贝后修改以下参数 broker.id log.dirs zookeeper.connect 数据迁移原理 只有新增的Topic才会将数据分布在新节点上,如果要将现有数据也分配到新节点,需要将Topic中的数据迁移到新节点上。 数 阅读全文
posted @ 2024-12-24 16:43 broadviews 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 有些情况下,你想重启一个特定的容器,而不是删除pod,让Kubernetes重新创建它,可以使用: kubectl exec POD_NAME -c CONTAINER_NAME /sbin/killall5 也可以: kubectl exec POD_NAME -c CONTAINER_NAME 阅读全文
posted @ 2024-12-12 15:57 broadviews 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 报错截图如下 查看etcd,发现超过默认值2G了 解决参考链接 https://cloud.tencent.com/developer/article/2360418 执行过程 PS: 高可用集群需要在所有master执行 # 1、获取当前的版本 $ rev=$(ETCDCTL_API=3 etcd 阅读全文
posted @ 2024-11-25 18:01 broadviews 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 操作系统信息 Static hostname: gpu-3-3 Icon name: computer-vm Chassis: vm Machine ID: 6cb7772dbbc94a898f257514651e7fb4 Boot ID: b20b92d049274ceca5202bfa3e8fe 阅读全文
posted @ 2024-11-25 15:48 broadviews 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 在 Kubernetes 集群中,kubeadm 提供了管理证书的功能,包括自动续签证书。以下是关于如何使用 kubeadm 自动续签证书的详细步骤: 证书自动续签机制 Kubernetes 1.15 及更高版本中,kubeadm 部署的证书默认有效期为 1 年。Kubernetes 控制平面包含一 阅读全文
posted @ 2024-11-18 16:14 broadviews 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 要将 Tomcat 容器的时区更改为中国(通常为东八区,即Asia/Shanghai),可以按照以下步骤配置。 方法一:修改 catalina.sh 或 catalina.bat 打开 Tomcat 的 bin 目录,找到启动脚本 catalina.sh(Linux/Unix)或 catalina. 阅读全文
posted @ 2024-11-13 15:37 broadviews 阅读(82) 评论(0) 推荐(0) 编辑
摘要: 一、rsync简介 rsync是linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSH、rsync主机同步。 Rsync 使用一个特殊的算法来识别文件的差异,并仅传输发生变化的部分,以实现高效的文件同步和备份。它还支持多种模式和选项 阅读全文
posted @ 2024-11-12 10:57 broadviews 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 要强制删除处于“Terminating”状态的 ingress-nginx 命名空间,您可以按照以下步骤操作: 获取命名空间的 JSON 描述并保存到文件: kubectl get namespace ingress-nginx -o json > ingress-nginx.json 编辑保存 阅读全文
posted @ 2024-11-07 15:52 broadviews 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 以下是 Elasticsearch 集群数据迁移 的步骤说明,格式已转换为 Markdown: Elasticsearch 集群数据迁移 一、订购新的集群 订购新集群时,注意以下事项: 新集群的数据节点数量需满足迁移需求,确保索引副本数小于节点数。 新集群节点规格(如 CPU、内存)应足够容纳旧集群 阅读全文
posted @ 2024-11-06 02:06 broadviews 阅读(34) 评论(0) 推荐(0) 编辑