摘要: 1、故障描述 这两天遇到一个非常诡异的问题,现在将完整的故障描述如下: 1)最初是同事跟我反馈k8s集群中有个worker node状态变为NoReady,该node的kubelet的error日志中发现大量这种日志 2) 查看message 日志,关于dockerd的日志包含以下错误 3)、doc 阅读全文
posted @ 2019-06-04 13:03 EdenLong 阅读(13998) 评论(0) 推荐(0) 编辑
摘要: 1、创建aggregator证书 方法一:直接使用二进制源码包安装 方式二:使用go命令安装 2、创建 CA (Certificate Authority) 创建 CA 配置文件 字段说明: profiles : 可以定义多个 profiles,分别指定不同的过期时间、使用场景等参数;后续在签名证书 阅读全文
posted @ 2019-04-26 12:02 EdenLong 阅读(1631) 评论(0) 推荐(0) 编辑
摘要: 1、带宽测试 在server端执行 [ibtests]# ib_send_bw -a -c UD -d mlx4_0 -i 1 Send BW Test Connection type : UD Inline data is used up to 1 bytes message local addr 阅读全文
posted @ 2019-01-15 18:10 EdenLong 阅读(11423) 评论(0) 推荐(0) 编辑
摘要: 一、前言 最近公司要求对一批GPU服务器安装操作系统,之前同事一直采用cobbler安装系统,一旦服务器设置为pxe优先启动,会出现重复安装系统的问题,并且如果线上服务器忘记修改第一启动项为硬盘启动,可能还会出现线上服务器计划外重装系统,造成数据丢失的风险。因为上一家我们一直采用foreman来安装 阅读全文
posted @ 2018-12-19 22:05 EdenLong 阅读(1706) 评论(0) 推荐(1) 编辑
摘要: 一、 环境说明:1、服务器列表:proxy01: eth0: 192.168.56.11 eth2: 192.168.156.11 proxy02: eth0: 192.168.56.12 eth2: 192.168.156.12 proxy03: eth0: 192.168.56.13 eth2: 阅读全文
posted @ 2018-12-06 20:17 EdenLong 阅读(2667) 评论(0) 推荐(0) 编辑