摘要:
熟悉InfiniBand(IB)和RDMA over Converged Ethernet(RoCE)网络的配置和优化。有成功部署和管理cube-studio的直接经验。容器编排(Kubernetes, Docker)、调度系统(Volcano, Kubeflow)、监控工具(Prometheus, 阅读全文
摘要:
[https://pandagpt.io](https://pandagpt.io) 1、 运维故障复盘,进行技术改进,开复盘会。PDCA改进运维方法。 2、 深度:关键运维技术进行难点进行攻克,在测试环境进行测试验证,在生产环境执行。指导其他运维进行难点问题处理。 3、 高度:对公司关键运维技术难 阅读全文
摘要:
自定义 DNS 服务 本页说明如何配置 DNS Pod,以及定制集群中 DNS 解析过程。 准备开始 你必须拥有一个 Kubernetes 的集群,同时你的 Kubernetes 集群必须带有 kubectl 命令行工具。 建议在至少有两个节点的集群上运行本教程,且这些节点不作为控制平面主机。 如果 阅读全文
摘要:
2022 09 11日开始坚持学会go语言 为了转型换个方向 rancher 部署三台 rac部署 1. 方向一 jenkins sornaqube jira 禅道集成 jenkins 方向二: k8s go开发 shell python编程方面 阅读全文
摘要:
根据我的经验,大多数人(使用Helm或手动yaml)将应用程序部署到Kubernetes上,然后认为他们就可以一直稳定运行。然而并非如此,实际使用过程还是遇到了一些“陷阱”,我希望在此处列出这些“陷阱”,以帮助您了解在Kubernetes上启动应用程序之前需要注意的一些问题。 Kubernetes调 阅读全文
摘要:
做事情要求有强烈的目标感 法不轻传,道不贱卖,师不顺路,医不叩门 阅读全文
摘要:
记大纲 填充大纲下面知识点 填充例子 默写代码 对照笔记填充 TRANSLATE with x English Arabic Hebrew Polish Bulgarian Hindi Portuguese Catalan Hmong Daw Romanian Chinese Simplified 阅读全文
摘要:
https://pythonav.com/wiki/ 阅读全文
摘要:
五大富豪教你获得成功:巴菲特说“投资自己” 五大富豪教你获得成功:巴菲特说“投资自己” 不过分追求自由 和 不过分放纵欲望编译|米娜 在即将过去的2019年,全球亿万富翁的队伍继续壮大。目前约有2604位亿万富翁,约占地球总人口的0.0002%。用“凤毛麟角”来形容这些超级富豪,一点也不为过!虽然, 阅读全文
摘要:
人一旦堕落,哪怕是短暂的几年,上帝就会以最快的速度,收走你的天赋和力量。 TRANSLATE with x English Arabic Hebrew Polish Bulgarian Hindi Portuguese Catalan Hmong Daw Romanian Chinese Simpl 阅读全文
摘要:
在AWS中,是否会更换实例的公网IP取决于您使用的IP地址类型。具体来说: 临时公网IP(也称为公共IP):当您启动一个新的EC2实例时,AWS会自动分配一个临时公网IP。如果您停止并重新启动该实例,临时公网IP会被释放,然后重新分配一个新的IP地址。因此,公网IP将会更换。 弹性公网IP(Elas 阅读全文
摘要:
NVIDIA GPU Operator 是一个用于在 Kubernetes 集群上自动化部署、配置和管理 NVIDIA GPU 及相关硬件资源的工具。它通过 Kubernetes Operator 框架来实现自动化管理,简化了在 Kubernetes 环境中使用 GPU 的过程。以下是 NVIDIA 阅读全文
摘要:
前提:nvidia、cuda、nvidia-fabricmanager等相关的组件已经在宿主机正确安装,如果没有安装可以参考我之前发的文章GPU A800 A100系列NVIDIA环境和PyTorch2.0基础环境配置【建议收藏】_a800多卡运行环境配置-CSDN博客文章浏览阅读1.1k次,点赞8 阅读全文
摘要:
AI 模型的开发、训练、推理和验证是一个系统的过程,涉及多个步骤。以下是详细的步骤流程: ### 1. 需求分析- **明确目标**:确定 AI 模型需要解决的具体问题,如图像分类、自然语言处理、语音识别等。- **定义性能指标**:确定评估模型性能的指标,如准确率、召回率、F1 分数等。 ### 阅读全文
摘要:
Ubuntu 22.04LTS版本二进制部署K8S 1.30+版本 目录 一.K8S集群各主机环境准备 1.环境准备 2.所有节点安装常用的软件包 3.k8s-master01节点免密钥登录集群并同步数据 4.所有节点Linux基础环境优化 5.所有节点安装ipvsadm以实现kube-proxy的 阅读全文
摘要:
1. RDMA ROCE 网卡 2. GPU插件device-plugin 3. gpu 虚拟化 4. volcano 调度 5. 网络选型cillum 阅读全文
摘要:
vim /home/opt/postgresql-16.0/data/postgresql.conf#设置以下listen_addresses = '*' # 允许远程连接hot_standby = on # 打开热备wal_level = replica # 设置 WAL 日志级别为 replic 阅读全文
摘要:
由于现在大多数公司使用私有化 git 仓库产品时一般选择 gitlab,所以借助其提供的 gitlab ci 功能来做 CI (Continuous Integration,可持续集成) 任务还是比较普遍的一种选型。本篇文档作为一个 gitlab 的入门教程,会设计到 gitlab runner 和 阅读全文
摘要:
在 Kubernetes 中,API 请求的处理主要由 API Server 负责。以下是 Kubernetes 处理 API 请求的基本流程: ### API Server 的角色- **核心组件**:API Server 是 Kubernetes 控制平面的核心组件,负责接收和处理来自客户端的所 阅读全文