安装promethues报错记录
1、执行kubectl create -f prometheus-rbac.yaml报错:
"prometheus-rbac.yaml": error validating data: apiVersion not set
原因:报错说了“apiVersion not set”,apiVersion没有设置,检查一下apiVersion在配置文件中有写吗,写对了吗,是不是少了个字母之类的。
2、报错:mount: wrong fs type, bad option, bad superblock on 192.168.1.111:/data/prometheus,
原因:nfs挂载问题,一般是有客户端没有安装nfs-utils,执行yum install nfs-utils安装就行了
3、kubectl logs -f prometheus-7cc859bccd-m5fvj -n kube-ops查看日志是报错:
error: a container name must be specified for pod prometheus-7cc859bccd-m5fvj, choose one of: [alertmanager prometheus-server]
原因:因为pod中不止一个容器,所以我们在看pod日志的时候,要加上容器名称:kubectl logs -f prometheus-7cc859bccd-m5fvj -n kube-ops -c alertmanager
4、启动alertmanager 容器报错,日志如下:
level=error ts=2020-05-19T03:19:58.540994885Z caller=main.go:179 msg="Unable to create data directory" err="mkdir data/: read-only file system"
原因:新版本dockerfile中的默认WORKDIR发生了变化,变成了/etc/alertmanager目录,默认情况下存储路径--storage.path是相对目录data/,因此,alertmanager 会在我们上面挂载的 ConfigMap 中去创建这个目录,所以会报错,我们可以通过覆盖--storage.path参数来解决这个问题
5、启动grafana报错:
running "VolumeBinding" filter plugin for pod "grafana-67c548f686-tc94b": pod has unbound immediate PersistentVolumeClaims
原因:没有可以绑定的pvc,查看一下提前做好pv和pvc没有,这两个需要在启动grafana之前准备好,检查一下磁盘大小是否符合要求。