kubernetes健康检查

有时候容器在running的状态,但是里面的服务挂了,这个就难办了,所以k8s提供了一种检查服务是否健康的方法

Liveness Probe的种类:
● ExecAction:在container中执行指定的命令。当其执行成功时,将其退出码设置为0;
● TCPSocketAction:执行一个TCP检查使用container的IP地址和指定的端口作为socket。如果端口处于打开状态视为成功;
● HTTPGetAcction:执行一个HTTP默认请求使用container的IP地址和指定的端口以及请求的路径作为url,用户可以通过host参数设置请求的地址,通过scheme参数设置协议类型(HTTP、HTTPS)如果其响应代码在200~400之间,设为成功。

当前kubelet拥有两个检测器,他们分别对应不通的触发器(根据触发器的结构执行进一步的动作):
● Liveness Probe:表示container是否处于live状态。如果 LivenessProbe失败,LivenessProbe将会通知kubelet对应的container不健康了。随后kubelet将kill掉 container,并根据RestarPolicy进行进一步的操作。默认情况下LivenessProbe在第一次检测之前初始化值为 Success,如果container没有提供LivenessProbe,则也认为是Success;

● ReadinessProbe:表示container是否以及处于可接受service请求的状态了。如 果ReadinessProbe失败,endpoints controller将会从service所匹配到的endpoint列表中移除关于这个container的IP地址。因此对于Service匹配到的 endpoint的维护其核心是ReadinessProbe。默认Readiness的初始值是Failure,如果一个container没有提供 Readiness则被认为是Success。

initialDelaySeconds:用来表示初始化延迟的时间,也就是告诉监测从多久之后开始运行,单位是秒
timeoutSeconds: 用来表示监测的超时时间,如果超过这个时长后,则认为监测失败

Liveness Probe配置的写法和ReadinessProbe的一样
示例:

(1)ExecAction:在容器内部执行一个命令,如果该命令的返回值为0,则表示容器健康。如下例子,启动后 rm -fr /tmp/health 删除该文件,后cat ,当然会返回0 文件不存在,那么检查结果为失败

apiVersion:v1 
kind: Pod 
metadata: 
  name: liveness-exec 
  label: 
    name: liveness 
spec: 
  containers: 
  - name: tomcat 
    image: grc.io/google_containers/tomcat 
    args: 
    - /bin/sh 
    - -c 
    - echo ok >/tmp.health;sleep 10; rm -fr /tmp/health;sleep 600 
    livenessProbe: 
      exec: 
        command: 
        - cat 
        - /tmp/health 
      initianDelaySeconds:15 
      timeoutSeconds:1  

  



(2)TCPSocketAction:通过容器ip地址和端口号执行TCP检查,如果能够建立tcp连接表明容器健康

kind: Pod 
metadata: 
  name: pod-with-healthcheck 
spec: 
  containers: 
  - name: nginx 
    image: nginx 
    livenessProbe: 
      tcpSocket:  
        port: 80 
      initianDelaySeconds:30 
      timeoutSeconds:1 

 



(3)HTTPGetAction:通过容器Ip地址、端口号及路径调用http get方法,如果响应的状态吗大于200且小于400,则认为容器健康


apiVersion:v1 
kind: Pod 
metadata: 
  name: pod-with-healthcheck 
spec: 
  containers: 
  - name: nginx 
    image: nginx 
    livenessProbe: 
      httpGet:  
        path: /_status/healthz 
        port: 80 
      initianDelaySeconds:30 
      timeoutSeconds:1 

 

对于每种探针方式,都需要设置initialDelaySeconds和timeoutSeconds两个参数,它们含义如下:
● initialDelaySeconds:启动容器后首次监控检查的等待时间,单位秒
● timeouSeconds:健康检查发送请求后等待响应的超时时间,单位秒。当发生超时就被认为容器无法提供服务无,该容器将被重启


posted @ 2017-10-18 09:44  深空灰  阅读(1650)  评论(0编辑  收藏  举报