[k8s]kubelet最佳实战
kubelet端口解析:
10250 –port: kubelet服务监听的端口,api会检测他是否存活
10248 –healthz-port: 健康检查服务的端口
10255 –read-only-port: 只读端口,可以不用验证和授权机制,直接访问
4194 –cadvisor-port: 当前节点 cadvisor 运行的端口
kubelet参数手头书
参数 | 解释 | 默认值 |
---|---|---|
–address | kubelet 服务监听的地址 | 0.0.0.0 |
–port | kubelet 服务监听的端口 | 10250 |
–read-only-port | 只读端口,可以不用验证和授权机制,直接访问 | 10255 |
–allow-privileged | 是否允许容器运行在 privileged 模式 | false |
–api-servers | 以逗号分割的 API Server 地址,用于和集群中数据交互 | [] |
–cadvisor-port | 当前节点 cadvisor 运行的端口 | 4194 |
–config 本地 manifest | 文件的路径或者目录 | "" |
–file-check-frequency | 轮询本地 manifest 文件的时间间隔 | 20s |
–container-runtime | 后端容器 runtime,支持 docker 和 rkt | docker |
–enable-server | 是否启动 kubelet HTTP server | true |
–healthz-bind-address | 健康检查服务绑定的地址,设置成 0.0.0.0 可以监听在所有网络接口 | 127.0.0.1 |
–healthz-port | 健康检查服务的端口 | 10248 |
–hostname-override | 指定 hostname,如果非空会使用这个值作为节点在集群中的标识 | "" |
–log-dir | 日志文件,如果非空,会把 log 写到该文件 | "" |
–logtostderr | 是否打印 log 到终端 | true |
–max-open-files | 允许 kubelet 打开文件的最大值 | 1000000 |
–max-pods | 允许 kubelet 运行 pod 的最大值 | 110 |
–pod-infra-container-image | 基础镜像地址,每个 pod 最先启动的容器,会配置共享的网络 | gcr.io/google_containers/pause-amd64:3.0 |
–root-dir | kubelet 保存数据的目录 | /var/lib/kubelet |
–runonce | 从本地 manifest 或者 URL 指定的 manifest 读取并运行结束就退出,和 --api-servers 、--enable-server 参数不兼容 | |
–v | 日志 level | 0 |
简单的启动kubelet
kubelet \
--api-servers=http://192.168.14.132:8080
完善的启动kubelet
kubelet \
--api-servers=http://192.168.14.132:8080 \
--pod-infra-container-image=kubeguide/pause-amd64:3.0 \
--allow-privileged=true \
--kubelethostname-override=192.168.14.133 \
--logtostderr=false \
--log-dir=/root/logs/ \
--v=2
查看node状态
参考:
https://k8smeetup.github.io/docs/concepts/architecture/nodes/
kubectl describe node
查看cadvisor(kubelet自带)
http://192.168.14.133:4194
状态观察
参考:
https://k8smeetup.github.io/docs/concepts/architecture/nodes/
- 50s容器由exit状态到删掉
kubectl delete -f busybox.yaml #50s容器由exit状态到删掉
- 5min节点好像由不可用到删除
kube-controller-manager一个参数:根据节点状态删除.
# The grace period for deleting pods on failed nodes. (default 5m0s)5分钟
--pod-eviction-timeout duration
Ready 条件处于状态 “Unknown” 或者 “False” 的时间超过了 pod-eviction-timeout(一个传递给 kube-controller-manager 的参数),node 上的所有 Pods 都会被 Node 控制器计划删除。默认的删除超时时长为5分钟。
kubelet报错但是没解决的-据说是1.7版本的bug.我是1.7.10
W1122 15:49:22.233484 71196 helpers.go:793] eviction manager: no observation found for eviction signal allocatableNodeFs.available
W1122 15:49:32.301474 71196 helpers.go:793] eviction manager: no observation found for eviction signal allocatableNodeFs.available
W1122 15:49:42.355303 71196 helpers.go:793] eviction manager: no observation found for eviction signal allocatableNodeFs.available
W1122 15:49:52.402125 71196 helpers.go:793] eviction manager: no observation found for eviction signal allocatableNodeFs.available
etcd报出问题--这个是etcd版本问题,不影响使用,我是yum install etcd搞的
[root@m1 yaml]# E1122 16:19:49.499797 57214 watcher.go:210] watch chan error: etcdserver: mvcc: required revision has been compacted
E1122 16:21:15.609115 57214 watcher.go:210] watch chan error: etcdserver: mvcc: required revision has been compacted
kubelet启动后会自动创建它的工作目录/var/lib/kubelet/
[root@n1 kubernetes]# tree /var/lib/kubelet/
/var/lib/kubelet/
├── plugins
└── pods
├── f56d5553-cf58-11e7-adbb-000c29154f03
│ ├── containers
│ │ └── busybox
│ │ └── 24bd58a0
│ ├── etc-hosts
│ ├── plugins
│ └── volumes
├── fffefc20-cf58-11e7-adbb-000c29154f03
│ ├── containers
│ │ └── nginx
│ │ └── 221a8328
│ ├── etc-hosts
│ ├── plugins
│ └── volumes
├── ffff1611-cf58-11e7-adbb-000c29154f03
│ ├── containers
│ │ └── nginx
│ │ └── d2d2f44d
│ ├── etc-hosts
│ ├── plugins
│ └── volumes
└── ffff1ff8-cf58-11e7-adbb-000c29154f03
├── containers
│ └── nginx
│ └── bd101c6e
├── etc-hosts
├── plugins
└── volumes