2.k8sPod、控制器、service

一、Pod生命周期

Pod是k8s中最小的管理单元（逻辑上存在，实际不存在），是一组容器的集合
同一个Pod中的容器共享网络和存储（通过pause容器实现），由一个统一的IP向集群内部提供服务
Pod分为自主式（死亡之后就会消失）和被控制器控制的（死亡之后会被控制器拉起来保持Pod的副本数量）
Pod的生命周期是短暂的，Pod死亡之后，重新创建的Pod和原来的Pod完全不一样

1、init c

init c 即 init container （初始化容器）
Pod能够具有多个容器，应用运行在容器里面，但是它也可能有一个或多个先于应用容器启动的Init容器
Init容器与普通的容器非常像，除了如下两点
- Init容器总是运行到成功完成为止
- 每个Init容器都必须在下一个Init容器启动之前成功完成
如果Pod的Init容器失败， Kubernetes 会不断地重启该Pod，直到Init容器成功为止。然而，如果Pod对应的 restartPolicy为Never,他不会重新启动

2、init c的作用

因为Init容器具有与应用程序容器分离的单独镜像，所以它们的启动相关代码具有如下优势
- 它们可以包含并运行实用工具，但是出于安全考虑，是不建议在应用程序容器镜像中包含这些实用工具的
- 它们可以包含使用工具和定制化代码来安装，但是不能出现在应用程序镜像中。例如，创建镜像没必要FROM另一个镜像，只需要在安装过程中使用类似 sed 、 awk 、 python或 dig这样的工具
- 应用程序镜像可以分离出创建和部署的角色，而没有必要联合它们构建一个单独的镜像
- Init容器使用 Linux Namespace ，所以相对应用程序容器来说具有不同的文件系统视图。因此，它们能够具有访问 Secret 的权限，而应用程序容器则不能
- 它们必须在应用程序容器启动之前运行完成，而应用程序容器是并行运行的，所以Init容器能够提供了一种简单的阻塞或延迟应用容器的启动的方法，直到满足了一组先决条件
也就是说在主容器启动之前使用init c可以做一些其他事情
- 读取配置文件等等（为保证主容器运行）
- 读取私密文件等等（保证系统的安全，init c一旦成功结束，就会删除，而读取私密文件放在主容器中，可能会出现安全隐患，因为主容器时一直运行）
- 但是不建议用init c去监测其他容器（比如，我们的服务mysql应该先启动，用init c去监测mysql的容器时是正常的，init c成功结束，但是主容器启动时mysql容器可能又挂了，所以这种方法不太准确）

3、特殊说明

在Pod启动过程中，Init容器会按顺序在网络和数据卷初始化之后启动。每个容器必须在下一个容器启动之前成功退出，init c按顺序执行，上一个执行成功之后才会执行下一个
如果由于运行时或失败退出，将导致容器启动失败，它会根据Pod的restartPolicy指定的策略进行重试。然而，如果Pod的restartPolicy设置为Always ，Init容器失败时会使用RestartPolicy策略
在所有的Init容器没有成功之前，Pod将不会变成Ready状态。Init容器的端口将不会在Service中进行聚集。正在初始化中的 Pod处于 Pending 状态，但应该会将 Initializing状态设置为 true
如果Pod重启，所有Init容器必须重新执行
对Init容器spec的修改被限制在容器image字段，修改其他字段都不会生效。更改Init容器的image字段，等价于重启该Pod
Init容器具有应用容器的所有字段。除了 readinessProbe ，因为Init容器无法定义不同于完成（completion）的就绪（readiness）之外的其他状态。这会在验证过程中强制执行
在Pod中的每个app和Init容器的名称必须唯一；与任何其它容器共享同一个名称，会在验证时抛出错误
start和stop会在main c 启动之后和结束之前做一些事情

4、init c资源清单示例

# pod 资源清单
apiVersion: v1
kind: Pod
metadata:
  name: initc-pod
  labels:
    app: myapp
spec:
  containers:
  - name: initc-container
    image: busybox
    command: ['sh', '-c', 'echo The app is running! && sleep 3600']
  # 以下为init c容器
  initContainers:
  # 第一个init c容器
  - name: init-myservice
    image: busybox
    # 监测service 看集群中有无名为myservice的service 直至监测到才会成功推出（直接写service名称可能不能解析，ping不同，解决方法如下）
    command: ['sh', '-c', 'until nslookup myservice; do echo waiting for myservice; sleep 2;done;']
  # 第一个init c容器
  - name: init-mydb
    image: busybox
    # 监测service 看集群中有无名为mydb的service 直至监测到才会成功推出
    command: ['sh', '-c', 'until nslookup mydb; do echo waiting for mydb; sleep 2; done;']

# 查看pod状态
[root@k8smaster pods]# kubectl get pod
NAME        READY   STATUS     RESTARTS   AGE
initc-pod   0/1     Init:0/2   0          43s

# 查看pod日志
[root@k8smaster pods]# kubectl logs initc-pod -c  init-myservice
;; connection timed out; no servers could be reached

waiting for myservice
;; connection timed out; no servers could be reached

waiting for myservice
;; connection timed out; no servers could be reached

......

# service 资源清单 简写svc
kind: Service
apiVersion: v1
metadata:
  name: myservice
spec:
  ports:
  	# 使用的协议 TCP和UDP可选
    - protocol: TCP
      # 暴露给k8s内部集群的端口
      port: 80
      # 也监听就是sevice的pod下容器 并且容器暴露端口为9376
      targetPort: 9376
# 用--- 分开表示一个yaml文件
---
kind: Service
apiVersion: v1
metadata:
  name: mydb
spec:
  ports:
    - protocol: TCP
      port: 80
      targetPort: 9377

# 启动名为myservice的service 查看pod状态
[root@k8smaster pods]# kubectl get pod
NAME                   READY   STATUS     RESTARTS   AGE
initc-pod              0/1     Init:1/2   0          57s

# 启动名为mydb的service 查看pod状态
[root@k8smaster pods]# kubectl get pod
NAME                   READY   STATUS    RESTARTS   AGE
initc-pod              1/1     Running   0          2m34s

解决pod内不能通过域名进行访问其他servce或者pod（ping 不同不管是clusterIp，还是名称）
- 问题原因：kubeadm安装的k8s的kube-proxy使用的iptables，需要修改为ipvs
- 1.开启ipvs支持（每个节点执行）
  - yum -y install ipvsadm ipset （好像可省略）
  - 永久生效：cat > /etc/sysconfig/modules/ipvs.modules <<EOF
    modprobe -- ip_vs
    modprobe -- ip_vs_rr
    modprobe -- ip_vs_wrr
    modprobe -- ip_vs_sh
    modprobe -- nf_conntrack_ipv4
    EOF
  - 临时生效：modprobe -- ip_vs
    modprobe -- ip_vs_rr
    modprobe -- ip_vs_wrr
    modprobe -- ip_vs_sh
    modprobe -- nf_conntrack_ipv4
- 2.修改权限（每个节点执行，好像可省略）
  - chmod 755 /etc/sysconfig/modules/ipvs.modules && bash /etc/sysconfig/modules/ipvs.modules && lsmod | grep -e ip_vs -e nf_conntrack_ipv4
- 3.修改kube-proxy的configMap
  - kubectl edit cm kube-proxy -n kube-system
  - ```
  ipvs:
        excludeCIDRs: null
        minSyncPeriod: 0s
        scheduler: ""
        strictARP: false
        syncPeriod: 30s
      kind: KubeProxyConfiguration
      metricsBindAddress: 127.0.0.1:10249
      mode: "ipvs" # 修改此处为ipvs
```
- 4.重启kube-proxy
  - kubectl get pod -n kube-system | grep kube-proxy |awk '{system("kubectl delete pod "$1" -n kube-system")}'
- 5.查看kube-proxy启动日志，确认是否为ipvs
  - kubectl logs -n kube-system kube-proxy-ff74q（自己的kube-proxy pod名）
  - ```
  # 有Using ipvs Proxier则配置成功
  I1215 09:18:42.852942       1 server_others.go:259] Using ipvs Proxier.
```
- 6.进入Pod中使用ping 命令测试，如果不行重启k8s集群后再试

5、健康检查（探针）

探针是由kubelet对容器执行的定期诊断。要执行诊断，kubelet调用由容器实现的Handler 。有三种类型的处理程序
- ExecAction ：在容器内执行指定命令。如果命令退出时返回码为 0 则认为诊断成功
- TCPSocketAction ：对指定端口上的容器的IP地址进行TCP检查。如果端口打开，则诊断被认为是成功的
- HTTPGetAction ：对指定的端口和路径上的容器的 IP地址执行 HTTP Get请求。如果响应的状态码大于等于200且小于400 ，则诊断被认为是成功的，可以防止端口是开的但是服务已经挂掉
每次探测都将获得以下三种结果之一
- 成功：容器通过了诊断
- 失败：容器未通过诊断
- 未知：诊断失败，因此不会采取任何行动

探针分类

readinessProbe ：指示容器是否准备好服务请求。如果就绪探测失败，端点控制器将从与Pod匹配的所有Service的端点中删除该Pod的IP地址。初始延迟之前的就绪状态默认为Failure 。如果容器不提供就绪探针，则默认状态为 Success，也就是在主容器创建时，检测该主容器是否已经准备就绪，可以向外界提供服务了，防止出现，容器启动了，但是容器中的服务还没有启动，这个是否向外界提供服务就会出现异常

readinessProbe只影响Realy状态，不会重启pod，重启pod会重新执行readinessProbe

资源清单示例

apiVersion: v1
kind: Pod
metadata:
  name: readiness-httpget-pod
  namespace: default
spec:
  containers:
  - name: readiness-httpget-container
    image: nginx
    # 镜像拉取方式，如果本地有就用本地
    imagePullPolicy: IfNotPresent
    # 就绪检查方式采用httpGet，默认的nginx肯定没有index1.html
    readinessProbe:
      httpGet:
        port: 80
        path: /index1.html
      # 开始检测延迟时间1s
      initialDelaySeconds: 1
      # 检测间隔时间3s
      periodSeconds: 3

启动readiness-httpget-pod并查看

# pod的状态为Running，但是READY没准备好
[root@k8smaster pods]# kubectl get pod
NAME                    READY   STATUS    RESTARTS   AGE
readiness-httpget-pod   0/1     Running   0          5m51s

# 查看pod的描述 就绪检测失败
[root@k8smaster pods]# kubectl describe pod  readiness-httpget-pod
Warning  Unhealthy  4m26s (x100 over 9m23s)  kubelet, k8snode2  Readiness probe failed: HTTP probe failed with statuscode: 404

进入Pod中添加index1.html

# 向/usr/share/nginx/html 中添加index1.html 后查看pod状态已经就绪
# kubectl exec -it pod名 -c 容器名（pod中只有一个容器可不指定） -- /bin/sh（执行的命令）
[root@k8smaster pods]# kubectl exec -it readiness-httpget-pod -c readiness-httpget-container -- /bin/sh
# cd /usr/share/nginx/html
# echo "123" >> index1.html
# ls
50x.html  index.html  index1.html
# exit

[root@k8smaster pods]# kubectl get pod
NAME                    READY   STATUS    RESTARTS   AGE
readiness-httpget-pod   1/1     Running   0          16m

livenessProbe ：指示容器是否正在运行。如果存活探测失败，则kubelet会杀死容器，并且容器将受到其重启策略的影响。如果容器不提供存活探针，则默认状态为Success，也就是为了防止僵尸进程存在，进程还在，不能提供服务

livenessProbe检测失败会重启pod，重启pod会重新执行readinessProbe

资源清单示例一：exec方式

apiVersion: v1
kind: Pod
metadata:
  name: liveness-exec-pod
  namespace: default
spec:
  containers:
  - name: liveness-exec-container
    image: busybox
    imagePullPolicy: IfNotPresent
    # 容器启动的命令 在/tmp下创建live文件 过30s删除
    command: ["/bin/sh","-c","touch /tmp/live ; sleep 30; rm -rf /tmp/live; sleep 3600"]
    # 存活检查采用 命令的方式 看/tmp下创建live文件存不存在 不存在则检测失败，使用Pod的重启策略
    livenessProbe:
      exec:
        command: ["test","-e","/tmp/live"]
      initialDelaySeconds: 1
      periodSeconds: 3

# 查看pod 在30s的时候进行了重启（也不一定是30s，因为容器启动也会浪费时间）
[root@k8smaster pods]# kubectl get pod
NAME                   READY   STATUS    RESTARTS   AGE
liveness-exec-pod      1/1     Running   0          29s
web-5dcb957ccc-r74d6   1/1     Running   0          28m

[root@k8smaster pods]# kubectl get pod
NAME                   READY   STATUS    RESTARTS   AGE
liveness-exec-pod      1/1     Running   1          32s
web-5dcb957ccc-r74d6   1/1     Running   0          28m

资源清单示例二：httpGet方式

apiVersion: v1
kind: Pod
metadata:
  name: liveness-httpget-pod
  namespace: default
spec:
  containers:
  - name: liveness-httpget-container
    image: nginx
    imagePullPolicy: IfNotPresent
    ports:
    - name: http
      # 该Pod监听其下容器的端口
      containerPort: 80
    # 存活检查采用 httpGet的方式 访问/index.html存不存在
    livenessProbe:
      httpGet:
        port: http
        path: /index.html
      initialDelaySeconds: 1
      periodSeconds: 3
      # 超时时间 超时代表失败
      timeoutSeconds: 10

# 查看pod状态
[root@k8smaster pods]# kubectl get pod
NAME                   READY   STATUS    RESTARTS   AGE
liveness-httpget-pod   1/1     Running   0          5m12s

# 进入pod删除index.html
[root@k8smaster pods]# kubectl exec -it liveness-httpget-pod -c readiness-httpget-container -- /bin/sh
# cd /usr/share/nginx/html
# rm index.html

# 查看pod状态
[root@k8smaster pods]# kubectl get pod
NAME                   READY   STATUS    RESTARTS   AGE
liveness-httpget-pod   1/1     Running   1          9m43s

资源清单示例三：tcp方式

apiVersion: v1
kind: Pod
metadata:
  name: liveness-tcp-pod
spec:
  containers:
  - name: liveness-tcp-container
    image: nginx
    # 存活检查采用 tcp的方式 检查8080端口
    livenessProbe:
      initialDelaySeconds: 5
      timeoutSeconds: 1
      periodSeconds: 3
      tcpSocket:
        port: 8080

# 查看pod状态 一直重启 因为8080端口一直不存在
NAME                   READY   STATUS    RESTARTS   AGE
liveness-tcp-pod       1/1     Running   4          104s

readinessProbe和livenessProbe 同时使用

资源清单示例

apiVersion: v1
kind: Pod
metadata:
  name: liveness-httpget-pod
  namespace: default
spec:
  containers:
  - name: liveness-httpget-container
    image: nginx
    imagePullPolicy: IfNotPresent
    ports:
    - name: http
      # 该Pod监听其下容器的端口
      containerPort: 80
    readinessProbe:
      httpGet:
        port: 80
        path: /index1.html
      # 开始检测延迟时间1s
      initialDelaySeconds: 1
      # 检测间隔时间3s
      periodSeconds: 3
    # 存活检查采用 httpGet的方式 访问/index.html存不存在
    livenessProbe:
      httpGet:
        port: http
        path: /index.html
      initialDelaySeconds: 1
      periodSeconds: 3
      # 超时时间 超时代表失败
      timeoutSeconds: 10

6、start和stop

Pod hook（钩子）是由 Kubernetes管理的kubelet发起的，当容器中的进程启动前或者容器中的进程终止之前运行，这是包含在容器的生命周期之中。可以同时为Pod中的所有容器都配置hookHook
Hook 的类型包括两种
- exec ：执行一段命令
- HTTP ：发送 HTTP 请求

资源清单示例

apiVersion: v1
kind: Pod
metadata:
  name: lifecycle-demo
spec:
  containers:
  - name: lifecycle-demo-container
    image: nginx
    lifecycle:
      # 容器启动后执行
      postStart:
        exec:
          command: ["/bin/sh", "-c", "echo Hello from the postStart handler >/usr/share/message"]
      # 容器关闭前执行
      preStop:
        exec:
          command: ["/bin/sh", "-c", "echo Hello from the poststop handler >/usr/share/message"]

# 进入容器查看
[root@k8smaster pods]# kubectl exec -it lifecycle-demo -- /bin/sh
# cat /usr/share/message
Hello from the postStart handler

7、pod状态

挂起（ Pending ）： Pod 已被 Kubernetes 系统接受，但有一个或者多个容器镜像尚未创建。等待时间包括调度 Pod
运行中（ Running ）：该 Pod 已经绑定到了一个节点上， Pod 中所有的容器都已被创建。至少有一个容器正在运行，或者正处于启动或重启状态
成功（ Succeeded ）： Pod 中的所有容器都被成功终止，并且不会再重启常见job和cronjob
失败（ Failed ）： Pod 中的所有容器都已终止了，并且至少有一个容器是因为失败终止。也就是说，容器以非 0
未知（ Unknown ）：因为某些原因无法取得 Pod 的状态，通常是因为与 Pod 所在主机通信失败

二、控制器

Kubernetes中内建了很多controller（控制器），这些相当于一个状态机，用来控制Pod的具体状态和行为，也就是说pod是最小的调度单元，而控制器用来管理pod,由控制器管理的pod死亡后，会被拉起，而没被管理的pod不会被管（也就是自主式pod）

1、Replication Controller(RC)

Replication Controller(RC)是Kubernetes系统中核心概念之一，当我们定义了一个 RC并提交到Kubernetes集群中以后，Master节点上的Controller Manager组件就得到通知，定期检查系统中存活的Pod,并确保目标Pod实例的数量刚好等于RC的预期值，如果有过多或过少的Pod运行，系统就会停掉或创建一些Pod.此外我们也可以通过修改RC副本数量，来实现Pod的动态缩放功能，也就是说RC用来确保容器应用的副本数始终保持在用户定义的副本数，即如果有容器异常退出，会自动创建新的Pod来替代；而如果异常多出来的容器也会自动回收

资源清单示例

apiVersion: v1
kind: ReplicationController
metadata:
  name: rcdemo
spec:
  # pod需要保持的副本数
  replicas: 3
  # RC的标签选择器
  selector:
    # 所管理的Pod上有tier=frontend 这个标签，也就是说RC是通过labels来区分自己要管理的Pod，不支持集合式的selector
    tier: frontend
  # template 相当于定义的Pod
  template:
    metadata:
      # pod的标签key=value的形式 如果跟RC所需要的一致，就会被匹配到的RC管理
      labels:
        tier: frontend
    spec:
      # pod中的容器
      containers:
      - name: mynginx
        image: nginx
        # 容器内部添加环境变量
        env:
        - name: GET_HOSTS_FROM
          value: dns
        ports:
        - containerPort: 80

# 创建RC 
[root@k8smaster deployments]# kubectl apply -f rcdemo.yaml
replicationcontroller/rcdemo created

# 查看rc DESIRED：设计数量 CURRENT：当前数量 READY：准备的数量
[root@k8smaster deployments]# kubectl get rc
NAME     DESIRED   CURRENT   READY   AGE
rcdemo   3         3         3       11m

并查看Pod Pod名称规则（控制器name+随机字符串）
[root@k8smaster deployments]# kubectl get pod
NAME           READY   STATUS    RESTARTS   AGE
rcdemo-4sgkd   1/1     Running   0          37s
rcdemo-hkhfw   1/1     Running   0          37s
rcdemo-xnr2n   1/1     Running   0          37s

# 删除所有pod 在查看pod是否被控制器拉起 
[root@k8smaster deployments]# kubectl delete pod --all
pod "rcdemo-4sgkd" deleted
pod "rcdemo-hkhfw" deleted
pod "rcdemo-xnr2n" deleted

# --show-labels（显示标签） 被拉起的Pod和原来的完全不一样 说明是重新创建的
[root@k8smaster deployments]# kubectl get pod --show-labels
NAME           READY   STATUS    RESTARTS   AGE   LABELS
rcdemo-bxtzt   1/1     Running   0          62s   tier=frontend
rcdemo-f2pnn   1/1     Running   0          62s   tier=frontend
rcdemo-gbxt4   1/1     Running   0          62s   tier=frontend

# 修改其中一个Pod的label 观察Pod情况 发现多了一个Pod（说明了控制器是通过label来控制Pod的）
[root@k8smaster deployments]# kubectl label pod rcdemo-bxtzt tier=frontend123 --overwrite
pod/rcdemo-bxtzt labeled
[root@k8smaster deployments]# kubectl get pod --show-labels
NAME           READY   STATUS    RESTARTS   AGE     LABELS
rcdemo-8kt4h   1/1     Running   0          14s     tier=frontend
rcdemo-bxtzt   1/1     Running   0          7m34s   tier=frontend123
rcdemo-f2pnn   1/1     Running   0          7m34s   tier=frontend
rcdemo-gbxt4   1/1     Running   0          7m34s   tier=frontend

2、ReplicaSet(RS)

Kubernetes 官方建议使用 RS（ReplicaSet ）替代 RC （ReplicationController ）进行部署，RS 跟 RC 没有本质的不同，只是名字不一样，并且 RS 支持集合式的 selector

资源清单示例

apiVersion: apps/v1
kind: ReplicaSet
metadata:
  name: rsdemo
spec:
  # pod需要保持的副本数
  replicas: 3
  # RC的标签选择器
  selector:
    # 所管理的Pod上需要有tier=frontend 这个标签，也就是说RS是通过labels来区分自己要管理的Pod，支持集合式的selector matchLabels等（RC不支持）
    matchLabels:
      tier: frontend
  # template 相当于定义的Pod
  template:
    metadata:
      # pod的标签key=value的形式 如果跟RC所需要的一致，就会被匹配到的RS管理
      labels:
        tier: frontend
    spec:
      # pod中的容器
      containers:
      - name: mynginx
        image: nginx
        # 容器内部添加环境变量
        env:
        - name: GET_HOSTS_FROM
          value: dns
        ports:
        - containerPort: 80

```
# 使用效果和RC一样
```

3、Deployment

Deployment 为 Pod 和 ReplicaSet 提供了一个声明式定义 (declarative) 方法，用来替代以前的ReplicationController来方便的管理应用，Kubenetes v1.2 引入的新概念，引入的目的是为了更好的解决 Pod 的编排问题，Deployment 内部使用了 Replica Set 来实现。Deployment 的定义与 Replica Set 的定义很类似
应用场景
- RS和RC只能维持Pod的副本数量，功能薄弱
- 定义 Deployment 来创建 Pod 和 ReplicaSet
- 滚动升级和回滚应用：可以动态的切换版本，底层使用不同的RS来实现的
- 扩容和缩容：增加或减少副本的数量
- 暂停和继续 Deployment
- 滚动升级和回滚
  - 说明：从V1版升级到V2版共有三个Pod副本
    - 1.创建新的RS1，创建一个（数量可控）新的V2Pod，当新的V2Pod可以正常使用后，删除一个旧的V1Pod，保证k8s集群中该中Pod的数量不会变，直至所有的V1Pod换成V2Pod，并且旧的RS不会被删除（用于回滚）
    - 2.回滚的过程和上述相反，启动旧的RS

资源清单示例

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
spec:
  replicas: 3
  # 这个版本的Deployment不能省去selector
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports:
        - containerPort: 80

# 启动Deployment 查看 Deployment 、rs（rs名称规则：Deployment的name+随机字符串） 和 pod （pod名称规则：rs的name+随机字符串）
# --record 方便查看版本
[root@k8smaster deployments]# kubectl apply -f nginx-deployment.yaml --record
deployment.apps/nginx-deployment created

[root@k8smaster deployments]# kubectl get deployment
NAME               READY   UP-TO-DATE   AVAILABLE   AGE
nginx-deployment   3/3     3            3           42s

[root@k8smaster deployments]# kubectl get rs
NAME                          DESIRED   CURRENT   READY   AGE
nginx-deployment-5bf87f5f59   3         3         3       47s

[root@k8smaster deployments]# kubectl get pod --show-labels
NAME                                READY   STATUS    RESTARTS   AGE   LABELS
nginx-deployment-5bf87f5f59-hxj25   1/1     Running   0          93s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-wgw7w   1/1     Running   0          93s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-zcf82   1/1     Running   0          93s   app=nginx,pod-template-hash=5bf87f5f59

# 动态扩容到10个Pod副本
[root@k8smaster deployments]# kubectl scale deployment nginx-deployment --replicas 10
deployment.apps/nginx-deployment scaled
[root@k8smaster deployments]# kubectl get pod --show-labels
NAME                                READY   STATUS    RESTARTS   AGE     LABELS
nginx-deployment-5bf87f5f59-58vtn   1/1     Running   0          29s     app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-dmrrs   1/1     Running   0          29s     app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-f7cl6   1/1     Running   0          29s     app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-g5n6j   1/1     Running   0          29s     app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-gsvpd   1/1     Running   0          29s     app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-hfmjh   1/1     Running   0          29s     app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-hxj25   1/1     Running   0          2m30s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-wgw7w   1/1     Running   0          2m30s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-wzjtm   1/1     Running   0          29s     app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-zcf82   1/1     Running   0          2m30s   app=nginx,pod-template-hash=5bf87f5f59

# 动态缩减到3个Pod副本 发现还是原来的那3个 说明会保留存活时间长的
[root@k8smaster deployments]# kubectl scale deployment nginx-deployment --replicas 3
deployment.apps/nginx-deployment scaled
[root@k8smaster deployments]# kubectl get pod --show-labels
NAME                                READY   STATUS    RESTARTS   AGE     LABELS
nginx-deployment-5bf87f5f59-hxj25   1/1     Running   0          3m11s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-wgw7w   1/1     Running   0          3m11s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-zcf82   1/1     Running   0          3m11s   app=nginx,pod-template-hash=5bf87f5f59
[root@k8smaster deployments]#

# 动态扩容和缩减都不会重新创建新的RS
[root@k8smaster deployments]# kubectl get rs
NAME                          DESIRED   CURRENT   READY   AGE
nginx-deployment-5bf87f5f59   3         3         3       5m9s

# 滚动更新 更新镜像版本 查看 RS 和 pod
[root@k8smaster deployments]# kubectl set image deployment/nginx-deployment nginx=nginx:1.9.1
deployment.apps/nginx-deployment image updated
# 已经创建了新的RS
[root@k8smaster deployments]# kubectl get rs
NAME                          DESIRED   CURRENT   READY   AGE
nginx-deployment-5bf87f5f59   3         3         3       9m46s
nginx-deployment-678645bf77   1         1         0       3s
# 已经启动的新Pod
[root@k8smaster deployments]# kubectl get pod --show-labels
NAME                                READY   STATUS              RESTARTS   AGE     LABELS
nginx-deployment-5bf87f5f59-hxj25   1/1     Running             0          9m49s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-wgw7w   1/1     Running             0          9m49s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-zcf82   1/1     Running             0          9m49s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-678645bf77-4k5ls   0/1     ContainerCreating   0          6s      app=nginx,pod-template-hash=678645bf77

# 持续观察 RS 和 pod READY的数量始终会保持在我们需要的副本数量
[root@k8smaster deployments]# kubectl get rs
NAME                          DESIRED   CURRENT   READY   AGE
nginx-deployment-5bf87f5f59   1         1         1       10m
nginx-deployment-678645bf77   3         3         2       41s
[root@k8smaster deployments]# kubectl get pod --show-labels
NAME                                READY   STATUS              RESTARTS   AGE   LABELS
nginx-deployment-5bf87f5f59-wgw7w   1/1     Running             0          10m   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-678645bf77-4k5ls   1/1     Running             0          48s   app=nginx,pod-template-hash=678645bf77
nginx-deployment-678645bf77-szk6f   1/1     Running             0          18s   app=nginx,pod-template-hash=678645bf77
nginx-deployment-678645bf77-tm4jl   0/1     ContainerCreating   0          16s   app=nginx,pod-template-hash=678645bf77

# 最终结果 旧的RS并没有删除
[root@k8smaster deployments]# kubectl get rs -o wide
NAME                          DESIRED   CURRENT   READY   AGE   CONTAINERS   IMAGES        SELECTOR
nginx-deployment-5bf87f5f59   0         0         0       23m   nginx        nginx:1.7.9   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-678645bf77   3         3         3       13m   nginx        nginx:1.9.1   app=nginx,pod-template-hash=678645bf77
[root@k8smaster deployments]# kubectl get pod --show-labels
NAME                                READY   STATUS    RESTARTS   AGE   LABELS
nginx-deployment-678645bf77-4k5ls   1/1     Running   0          67s   app=nginx,pod-template-hash=678645bf77
nginx-deployment-678645bf77-szk6f   1/1     Running   0          37s   app=nginx,pod-template-hash=678645bf77
nginx-deployment-678645bf77-tm4jl   1/1     Running   0          35s   app=nginx,pod-template-hash=678645bf77

# 使用 kubectl edit deployment/nginx-deployment 可以编辑资源的yaml

# 回滚到上一个版本 启用上一个版本对应的RS
[root@k8smaster deployments]# kubectl rollout undo deployment/nginx-deployment
deployment.apps/nginx-deployment rolled back
[root@k8smaster deployments]# kubectl get rs -o wide
NAME                          DESIRED   CURRENT   READY   AGE   CONTAINERS   IMAGES        SELECTOR
nginx-deployment-5bf87f5f59   2         2         1       27m   nginx        nginx:1.7.9   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-678645bf77   2         2         2       17m   nginx        nginx:1.9.1   app=nginx,pod-template-hash=678645bf77
[root@k8smaster deployments]# kubectl get pod --show-labels
NAME                                READY   STATUS        RESTARTS   AGE   LABELS
nginx-deployment-5bf87f5f59-97lds   1/1     Running       0          9s    app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-lb7mm   1/1     Running       0          13s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-zltbv   1/1     Running       0          11s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-678645bf77-4k5ls   0/1     Terminating   0          18m   app=nginx,pod-template-hash=678645bf77
nginx-deployment-678645bf77-szk6f   0/1     Terminating   0          17m   app=nginx,pod-template-hash=678645bf77
nginx-deployment-678645bf77-tm4jl   0/1     Terminating   0          17m   app=nginx,pod-template-hash=678645bf77
[root@k8smaster deployments]# kubectl get rs -o wide
NAME                          DESIRED   CURRENT   READY   AGE   CONTAINERS   IMAGES        SELECTOR
nginx-deployment-5bf87f5f59   3         3         3       28m   nginx        nginx:1.7.9   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-678645bf77   0         0         0       18m   nginx        nginx:1.9.1   app=nginx,pod-template-hash=678645bf77
[root@k8smaster deployments]# kubectl get pod --show-labels
NAME                                READY   STATUS    RESTARTS   AGE   LABELS
nginx-deployment-5bf87f5f59-97lds   1/1     Running   0          26s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-lb7mm   1/1     Running   0          30s   app=nginx,pod-template-hash=5bf87f5f59
nginx-deployment-5bf87f5f59-zltbv   1/1     Running   0          28s   app=nginx,pod-template-hash=5bf87f5f59

# 查看回滚状态如果 rollout 成功完成， kubectl rollout status 将返回一个0值的 Exit Code
[root@k8smaster deployments]# kubectl rollout status deployment/nginx-deployment
deployment "nginx-deployment" successfully rolled out
[root@k8smaster deployments]# echo $?
0

# 查看版本 前面的REVISION可用于回退于指定版本
[root@k8smaster deployments]# kubectl rollout history deployment/nginx-deployment

deployment.apps/nginx-deployment
REVISION  CHANGE-CAUSE
2         kubectl apply --filename=nginx-deployment.yaml --record=true
3         kubectl apply --filename=nginx-deployment.yaml --record=true

# Deployment 更新策略
# Deployment 可以保证在升级时只有一定数量的 Pod 是 down 的。默认的，它会确保至少有比期望的Pod数量少一个是up状态（最多一个不可用）
# Deployment 同时也可以确保只创建出超过期望数量的一定数量的 Pod。默认的，它会确保最多比期望的Pod数量多一个的 Pod 是 up 的（最多1个 surge ）
[root@k8smaster deployments]# kubectl describe deployments
Name:                   nginx-deployment
Namespace:              default
CreationTimestamp:      Wed, 16 Dec 2020 10:57:54 +0800
Labels:                 <none>
Annotations:            deployment.kubernetes.io/revision: 3
                        kubernetes.io/change-cause: kubectl apply --filename=nginx-deployment.yaml --record=true
Selector:               app=nginx
Replicas:               3 desired | 3 updated | 3 total | 3 available | 0 unavailable
StrategyType:           RollingUpdate
MinReadySeconds:        0
RollingUpdateStrategy:  25% max unavailable, 25% max surge

# 未来的 Kuberentes 版本中，将从1-1变成25%-25%

Rollover（多个rollout并行）
- 假如您创建了一个有5个niginx:1.7.9 replica的Deployment，但是当还只有3个nginx:1.7.9 的 replica 创建出来的时候您就开始更新含有5个 nginx:1.9.1 replica 的 Deployment。在这种情况下，Deployment 会立即杀掉已创建的3个 nginx:1.7.9 的 Pod，并开始创建 nginx:1.9.1 的 Pod。它不会等到所有的5个 nginx:1.7.9 的Pod 都创建完成后才开始改变航道

回退Deployment

# 查看版本历史记录 REVISION可用于回退于指定版本
kubectl rollout history deployment/nginx-deployment
[root@k8smaster deployments]# kubectl rollout history deployment/nginx-deployment

deployment.apps/nginx-deployment
REVISION  CHANGE-CAUSE
2         kubectl apply --filename=nginx-deployment.yaml --record=true
3         kubectl apply --filename=nginx-deployment.yaml --record=true

# 回退到当前的上一个版本
kubectl rollout undo deployment/nginx-deployment

# 回退到指定版本 可以使用 --revision参数指定某个历史版本
kubectl rollout undo deployment/nginx-deployment --to-revision=2

# 暂停 deployment 的更新
kubectl rollout pause deployment/nginx-deployment

# 通过设置.spec.revisonHistoryLimit来指定deployment最多保留多少revision历史记录。默认会保留所有revision；如果将该项设置为0，Deployment 就不能回退

4、DaemonSet

DaemonSet 确保全部（或者一些）Node上运行一个Pod 的副本。当有Node加入集群时，也会为他们新增一个Pod 。当有Node从集群移除时，这些Pod也会被回收。删除DaemonSet将会删除它创建的所有Pod，也就是说由DaemoSet控制的Pod会在每个Node上都会运行一个，相当于一个守护模式，当有新的Node加入到集群时，新的Node也会有这种Pod，当有Node退出集群时，这个Node上的Pod就会删除
应用场景
- 运行集群存储 daemon，例如在每个 Node 上运行 glusterd 、 ceph
- 在每个 Node 上运行日志收集 daemon，例如 fluentd 、 logstash
- 在每个 Node 上运行监控 daemon，例如 Prometheus Node Exporter、 collectd 、Datadog 代理、New Relic 代理，或 Ganglia gmond

资源清单示例

apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: deamonset-example
  labels:
    app: daemonset
spec:
  selector:
    matchLabels:
      name: deamonset-example
  template:
    metadata:
      labels:
        name: deamonset-example
    spec:
      containers:
      - name: daemonset-example
        image: nginx

# 启动deamonset-example
[root@k8smaster deployments]# kubectl apply -f deamonset-example.yaml
daemonset.apps/deamonset-example created

# 查看 DaemonSet
[root@k8smaster deployments]# kubectl get daemonset
NAME                DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR   AGE
deamonset-example   2         2         2       2            2           <none>          71s

# 查看 Pod node1和node2节点上各一个
[root@k8smaster deployments]# kubectl get pod -o wide
NAME                                READY   STATUS    RESTARTS   AGE    IP            NODE       NOMINATED NODE   READINESS GATES
deamonset-example-5l9f6             1/1     Running   0          28s    10.244.2.31   k8snode1   <none>           <none>
deamonset-example-lwhrl             1/1     Running   0          28s    10.244.1.35   k8snode2   <none>           <none>

5、StatefulSet

StatefulSet作为Controller为Pod提供唯一的标识。它可以保证部署和scale的顺序
StatefulSet是为了解决有状态服务的问题（对应Deployments和ReplicaSets是为无状态服务而设计）例如mysql
应用场景
- 定的持久化存储，即Pod重新调度后还是能访问到相同的持久化数据，基于PVC来实现
- 稳定的网络标志，即Pod重新调度后其PodName和HostName不变，基于Headless Service（即没有Cluster IP的Service）来实现
- 有序部署，有序扩展，即Pod是有顺序的，在部署或者扩展的时候要依据定义的顺序依次依次进行（即从0到N-1，在下一个Pod运行之前所有之前的Pod必须都是Running和Ready状态），基于init containers来实现
- 有序收缩，有序删除（即从N-1到0）
需要用到的知识有service，pvc存储等，可先跳过，先学习下前置知识
在PVC模块详细介绍

6、Job

Job 负责批处理任务，即仅执行一次的任务，它保证批处理任务的一个或多个 Pod 成功结束
Job Spec
- spec.template格式同Pod
- RestartPolicy仅支持Never或OnFailure（仅执行成功一次所以不能用Always）
- 单个Pod时，默认Pod成功运行后Job即结束
- .spec.completions 标志Job结束需要成功运行的Pod个数，默认为1 （Pod的返回码为0时成功一次）
- .spec.parallelism 标志并行运行的Pod的个数，默认为1
- .spec.activeDeadlineSeconds 标志失败Pod的重试最大时间，超过这个时间不会继续重试

资源清单示例

apiVersion: batch/v1
kind: Job
metadata:
  name: pi
spec:
  template:
    metadata:
      name: pi
    spec:
      containers:
      - name: pi
        # 该镜像用于计算圆周率 CMD是将2000位的圆周率输出
        image: perl
        command: ["perl", "-Mbignum=bpi", "-wle", "print bpi(2000)"]
      restartPolicy: Never

# 创建job
[root@k8smaster deployments]# kubectl apply -f job-test.yaml
job.batch/pi created

# 查看job 已经成功结束
[root@k8smaster deployments]# kubectl get job
NAME   COMPLETIONS   DURATION   AGE
pi     1/1           90s        109s

# 查看pod 已经成功结束
[root@k8smaster deployments]# kubectl get pod
NAME                                READY   STATUS      RESTARTS   AGE
pi-ljl4g                            0/1     Completed   0          101s

# 查看pod日志
[root@k8smaster deployments]# kubectl logs pi-ljl4g
3.1415926535897932384626433832795028841971693993751058209...以后位数省略

7、CronJob

CronJob管理基于时间的 Job
- 在给定时间点只运行一次
- 周期性地在给定时间点运行
- 使用条件：当前使用的 Kubernetes 集群，版本 >= 1.8（对 CronJob）
- CronJob通过创建Job来进行管理
应用场景
- 在给定的时间点调度 Job 运行
- 建周期性运行的 Job，例如：数据库备份、发送邮件
CronJob Spec
- .spec.schedule指定任务运行周期，格式同Cron
- .spec.jobTemplate指定需要运行的任务，格式同Job，包含了.spec.completions、.spec.parallelism、.spec.activeDeadlineSeconds
- .spec.startingDeadlineSeconds ：启动 Job 的期限（秒级别），该字段是可选的。如果因为任何原因而错过了被调度的时间，那么错过执行时间的 Job 将被认为是失败的。如果没有指定，则没有期限
- .spec.concurrencyPolicy ：并发策略，该字段也是可选的。它指定了如何处理被 Cron Job 创建的 Job 的并发执行。只允许指定下面策略中的一种：
  - Allow （默认）：允许并发运行 Job
  - Forbid ：禁止并发运行，如果前一个还没有完成，则直接跳过下一个
  - Replace ：取消当前正在运行的 Job，用一个新的来替换
  - 注意，当前策略只能应用于同一个 Cron Job 创建的 Job。如果存在多个 Cron Job，它们创建的 Job 之间总是允许并发运行
- .spec.suspend ：挂起，该字段也是可选的。如果设置为true ，后续所有执行都会被挂起。它对已经开始执行的Job不起作用。默认值为 false
- .spec.successfulJobsHistoryLimit和.spec.failedJobsHistoryLimit ：历史限制，是可选的字段。它们指定了可以保留多少完成和失败的 Job。默认情况下，它们分别设置为3和1 。设置限制的值为0 ，相关类型的Job完成后将不会被保留
- .spec.startingDeadlineSeconds指定任务开始的截止期限

资源清单示例

apiVersion: batch/v1beta1
kind: CronJob
metadata:
  name: hello
spec:
  # 一分钟创建一个Job去执行 （分钟 小时 天 月 周）
  schedule: "*/1 * * * *"
  jobTemplate:
    spec:
      template:
        spec:
          containers:
          - name: hello
            image: busybox
            args:
            - /bin/sh
            - -c
            - date; echo Hello from the Kubernetes cluster
          restartPolicy: OnFailure

# 启动cronjob
[root@k8smaster deployments]# kubectl apply -f cronjob-test.yaml
cronjob.batch/hello created

# 查看cronjob
[root@k8smaster deployments]# kubectl get cronjob
NAME    SCHEDULE      SUSPEND   ACTIVE   LAST SCHEDULE   AGE
hello   */1 * * * *   False     0        <none>          12s

# 等待几分钟查看job和pod 默认只保留3条
[root@k8smaster deployments]# kubectl get job
NAME               COMPLETIONS   DURATION   AGE
hello-1608103680   1/1           16s        2m49s
hello-1608103740   1/1           17s        108s
hello-1608103800   1/1           17s        48s
[root@k8smaster deployments]# kubectl get pod
NAME                     READY   STATUS      RESTARTS   AGE
hello-1608103680-68c5t   0/1     Completed   0          2m54s
hello-1608103740-9rwpl   0/1     Completed   0          114s
hello-1608103800-fjv7z   0/1     Completed   0          54s

注意事项：
- 创建Job操作应该是幂等的（防止后面的运行结果影响前面的结果）
- cronjob不能连接到job的成功，只会周期的创建job，但是job是否运行成功可以监测到

三、Service

Kubernetes Service定义了这样一种抽象：一个Pod的逻辑分组，一种可以访问它们的策略 —— 通常称为微服务。这一组Pod能够被Service访问到，通常是通过Label Selector,标签选择不到创建的是空集群
Kubernetes Service可以为一组具有相同功能的容器应用提供一个统一的入口地址，并且将请求负载分发到后端的各个容器应用上，提供了服务注册与发现(因为Pod挂掉之后，新创建的Pod的原来的完全不一样，防止Pod失联)，相当于注册中心
Service能够提供负载均衡的能力，但是在使用上有以下限制
- 只提供 4 层负载均衡能力，而没有7层功能，但有时我们可能需要更多的匹配规则来转发请求，这点上 4 层负载均衡是不支持的，仅支持轮询算法
- 四层负载均衡：通过Ip和端口进行转发
- 七层负载均衡：主机和域名进行转发（k8s通过ingress可以实现）
service原理：
service分类
- ClusterIp：默认类型，自动分配一个仅 Cluster 内部可以访问的虚拟 IP
- NodePort：在 ClusterIP 基础上为 Service 在每台机器上绑定一个端口，这样就可以通过 : NodePort 来访问该服务
- LoadBalancer：在 NodePort 的基础上，借助 cloud provider 创建一个外部负载均衡器，并将请求转发到: NodePort
- ExternalName：把集群外部的服务引入到集群内部来，在集群内部直接使用。没有任何类型代理被创建，这只有 kubernetes 1.7 或更高版本的 kube-dns 才支持
VIP和Service代理
- 在 Kubernetes 集群中，每个 Node 运行一个kube-proxy 进程。kube-proxy负责为Service实现了一种VIP（虚拟 IP）的形式，而不是ExternalName的形式。在Kubernetes v1.0 版本，代理完全在 userspace。在Kubernetes v1.1 版本，新增了 iptables 代理，但并不是默认的运行模式。从 Kubernetes v1.2 起，默认就是iptables 代理。在 Kubernetes v1.8.0-beta.0 中，添加了 ipvs 代理
  在 Kubernetes 1.14 版本开始默认使用 ipvs 代理
- 在 Kubernetes v1.0 版本， Service 是 “4层”（TCP/UDP over IP）概念。在 Kubernetes v1.1 版本，新增了Ingress API（beta 版），用来表示 “7层”（HTTP）服务
- 为什么不使用DNS代理
  - 因为DNS有缓存，不能实现负载均衡
代理模式分类
- userspace 代理模式
- iptables 代理模式
- ipvs 代理模式
  - 这种模式，kube-proxy 会监视 Kubernetes Service 对象和 Endpoints ，调用 netlink 接口以相应地创建ipvs 规则并定期与 Kubernetes Service 对象和 Endpoints 对象同步 ipvs 规则，以确保 ipvs 状态与期望一致。访问服务时，流量将被重定向到其中一个后端 Pod与 iptables 类似，ipvs 于 netfilter 的 hook 功能，但使用哈希表作为底层数据结构并在内核空间中工作。这意味着 ipvs 可以更快地重定向流量，并且在同步代理规则时具有更好的性能。此外，ipvs 为负载均衡算法提供了更多选项，例如：
    - rr ：轮询调度
    - lc ：最小连接数
    - dh ：目标哈希
    - sh ：源哈希
    - sed ：最短期望延迟
    - nq ：不排队调度

1、ClusterIp

默认类型，自动分配一个仅Cluster内部可以访问的虚拟IP（自身节点也可访问）
clusterIP 主要在每个 node 节点使用 iptables或ipvs，将发向 clusterIP 对应端口的数据，转发到 kube-proxy 中。然后 kube-proxy 自己内部实现有负载均衡的方法，并可以查询到这个 service 下对应 pod 的地址和端口，进而把数据转发给对应的 pod 的地址和端口
- apiserver 用户通过kubectl命令向apiserver发送创建service的命令，apiserver接收到请求后将数据存储到etcd中
- kube-proxy kubernetes的每个节点中都有一个叫做kube-porxy的进程，这个进程负责感知service，pod的变化，并将变化的信息写入本地的iptables规则中
- iptables 使用NAT等技术将virtualIP的流量转至endpoint中
- 服务支持tcp和UDP，但是默认的是TCP

资源清单示例

# deployment 的资源清单
apiVersion: apps/v1
kind: Deployment
metadata:
  name: myapp-deploy
  namespace: default
spec:
  replicas: 3
  selector:
    # 需要匹配的标签
    matchLabels:
      app: myapp
      release: stabel
  template:
    metadata:
      # Pod携带的标签
      labels:
        app: myapp
        release: stabel
        env: test
    spec:
      containers:
      - name: myapp
        image: nginx
        imagePullPolicy: IfNotPresent
        ports:
        - name: http
          containerPort: 80

# ClusterIP service 的资源清单
apiVersion: v1
kind: Service
metadata:
  name: myapp
  namespace: default
spec:
  # service 的类型
  type: ClusterIP
  # 通过标签来选择pod，需全部满足
  selector:
    app: myapp
    release: stabel
  # 暴露端口
  ports:
  # name 是pod的一个端口
  - name: http
    # 集群内部使用的端口
    port: 80
    # 转发到其下Pod的容器端口 负载均衡算法是轮询
    targetPort: 80

# 创建myapp-deploy的deployment 并查看Pod
[root@k8smaster services]# kubectl apply -f myapp-deploy.yaml
deployment.apps/myapp-deploy created
[root@k8smaster services]# kubectl get deployment
NAME           READY   UP-TO-DATE   AVAILABLE   AGE
myapp-deploy   3/3     3            3           14s
[root@k8smaster services]# kubectl get pod
NAME                            READY   STATUS    RESTARTS   AGE
myapp-deploy-7c4dbc97b9-qk62v   1/1     Running   0          20s
myapp-deploy-7c4dbc97b9-qvx4h   1/1     Running   0          20s
myapp-deploy-7c4dbc97b9-svsww   1/1     Running   0          20s

# 创建service并查看
[root@k8smaster services]# kubectl apply -f clusterip.yaml
service/myapp created
[root@k8smaster services]# kubectl get svc -o wide
NAME         TYPE        CLUSTER-IP     EXTERNAL-IP   PORT(S)   AGE     SELECTOR
kubernetes   ClusterIP   10.96.0.1      <none>        443/TCP   20h     <none>
myapp        ClusterIP   10.110.54.87   <none>        80/TCP    6m28s   app=myapp,release=stabel

# 使用 CLUSTER-IP 进行访问
[root@k8smaster services]# curl 10.110.54.87:80
<!DOCTYPE html>
<html>
<head>
<title>Welcome to nginx!</title>
<style>
    body {
        width: 35em;
        margin: 0 auto;
        font-family: Tahoma, Verdana, Arial, sans-serif;
    }
</style>
</head>
<body>
<h1>Welcome to nginx!</h1>
<p>If you see this page, the nginx web server is successfully installed and
working. Further configuration is required.</p>

<p>For online documentation and support please refer to
<a href="http://nginx.org/">nginx.org</a>.<br/>
Commercial support is available at
<a href="http://nginx.com/">nginx.com</a>.</p>

<p><em>Thank you for using nginx.</em></p>
</body>
</html>

2、Headless

有时不需要或不想要负载均衡，以及单独的 Service IP 。遇到这种情况，可以通过指定 ClusterIP(spec.clusterIP) 的值为 “None” 来创建 Headless Service 。这类 Service 并不会分配 Cluster IP， kube-proxy 不会处理它们，而且平台也不会为它们进行负载均衡和路由，简单点说CLUSTER-IP为None 部署有状态服务时必须使用

资源清单示例

apiVersion: v1
kind: Service
metadata:
  name: myapp-headless
  namespace: default
spec:
  selector:
    app: myapp
  clusterIP: "None"
  ports:
  - port: 80
    targetPort: 80

# 创建无头service并查看
[root@k8smaster services]# kubectl apply -f headless.yaml
service/myapp-headless created
[root@k8smaster services]# kubectl get svc -o wide
NAME             TYPE        CLUSTER-IP   EXTERNAL-IP   PORT(S)   AGE   SELECTOR
kubernetes       ClusterIP   10.96.0.1    <none>        443/TCP   21h   <none>
myapp-headless   ClusterIP   None         <none>        80/TCP    4s    app=myapp

# 通过endpoints查看其关联的Pod
[root@k8smaster services]# kubectl get endpoints
NAME             ENDPOINTS                                      AGE
kubernetes       192.168.47.150:6443                            66s
myapp-headless   10.244.1.76:80,10.244.2.73:80,10.244.2.74:80   8s

通过解析域名的方式查看Headless所关联的Pod（也就意味着没有CLUSTER-IP，还能使用域名的方式去访问Headless）

# 查看系统Pod 其中 coredns 就是负责域名解析的
[root@k8smaster services]# kubectl get pod -n  kube-system -o wide
NAME                                READY   STATUS    RESTARTS   AGE     IP               NODE        NOMINATED NODE   READINESS GATES
coredns-7ff77c879f-494fb            1/1     Running   2          41h     10.244.2.14      k8snode1    <none>           <none>
coredns-7ff77c879f-tvgrz            1/1     Running   2          42h     10.244.1.20      k8snode2    <none>           <none>
etcd-k8smaster                      1/1     Running   3          6d14h   192.168.47.150   k8smaster   <none>           <none>
kube-apiserver-k8smaster            1/1     Running   3          6d14h   192.168.47.150   k8smaster   <none>           <none>
kube-controller-manager-k8smaster   1/1     Running   15         6d14h   192.168.47.150   k8smaster   <none>           <none>
kube-flannel-ds-amd64-hflj8         1/1     Running   4          6d1h    192.168.47.150   k8smaster   <none>           <none>
kube-flannel-ds-amd64-s9xhk         1/1     Running   3          6d1h    192.168.47.162   k8snode2    <none>           <none>
kube-flannel-ds-amd64-wp7mp         1/1     Running   4          6d1h    192.168.47.161   k8snode1    <none>           <none>
kube-proxy-5l8kb                    1/1     Running   2          42h     192.168.47.150   k8smaster   <none>           <none>
kube-proxy-6n8vp                    1/1     Running   2          42h     192.168.47.161   k8snode1    <none>           <none>
kube-proxy-lgcxp                    1/1     Running   2          42h     192.168.47.162   k8snode2    <none>           <none>
kube-scheduler-k8smaster            1/1     Running   16         6d14h   192.168.47.150   k8smaster   <none>           <none>

# 使用dig 命令 解析域名 dig -t A service名.命名空间名.svc.cluster.local.（默认集群域名） @coredns的Ip（任意一个即可）
# 如果没有dig 命令 安装即可 yum -y install bind-utils
# 我们发现 其中所关联的Pod都显示了出来
[root@k8smaster services]# dig -t A myapp-headless.default.svc.cluster.local. @10.244.2.14

; <<>> DiG 9.11.13-RedHat-9.11.13-3.el8 <<>> -t A myapp-headless.default.svc.cluster.local. @10.244.2.14
;; global options: +cmd
;; Got answer:
;; WARNING: .local is reserved for Multicast DNS
;; You are currently testing what happens when an mDNS query is leaked to DNS
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 37833
;; flags: qr aa rd; QUERY: 1, ANSWER: 3, AUTHORITY: 0, ADDITIONAL: 1
;; WARNING: recursion requested but not available

;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 4096
; COOKIE: 96e732da9566602d (echoed)
;; QUESTION SECTION:
;myapp-headless.default.svc.cluster.local. IN A

;; ANSWER SECTION:
myapp-headless.default.svc.cluster.local. 30 IN A 10.244.2.73
myapp-headless.default.svc.cluster.local. 30 IN A 10.244.2.74
myapp-headless.default.svc.cluster.local. 30 IN A 10.244.1.76

;; Query time: 2 msec
;; SERVER: 10.244.2.14#53(10.244.2.14)
;; WHEN: Thu Dec 17 11:02:40 CST 2020
;; MSG SIZE  rcvd: 249

3、NodePort

nodePort的原理在于在node上开了一个端口，将向该端口的流量导入到kube-proxy，然后由kube-proxy进一步到给对应的pod
将服务暴露给集群外部使用，可指定端口
NodePort，Kubernetes master会分配一个区域范围内，（默认是30000-32767），并且，每一个node，都会代理（proxy）这个端口到你的服务中，我们可以在spec.ports[*].nodePort 找到具体的值，如果我们向指定一个端口，我们可以直接写在nodePort上，系统就会给你指派指定端口，但是这个值必须是指定范围内的

资源清单示例

apiVersion: v1
kind: Service
metadata:
  name: myapp-nodeport
  namespace: default
spec:
  type: NodePort
  selector:
    app: myapp
    release: stabel
  ports:
  - name: http
    port: 80
    targetPort: 80
    # node暴露的端口 外界使用任意nodeIp:该端口  不指定随机分配
    nodePort: 30001

# 创建myapp-nodeport并查看service
[root@k8smaster services]# kubectl apply -f nodeport.yaml
service/myapp-nodeport created
[root@k8smaster services]# kubectl get svc -o wide
NAME             TYPE        CLUSTER-IP     EXTERNAL-IP   PORT(S)        AGE   SELECTOR
kubernetes       ClusterIP   10.96.0.1      <none>        443/TCP        21h   <none>
myapp-nodeport   NodePort    10.111.91.90   <none>        80:30001/TCP   4s    app=myapp,release=stabel

# 经过测试 在外界使用任意nodeIp:30001 都可访问成功

# iptables -t nat -nvL  查询转发流程
# ipvsadm -Ln 查询转发流程 
[root@k8smaster services]# ipvsadm -Ln
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
  -> RemoteAddress:Port           Forward Weight ActiveConn InActConn
TCP  10.96.0.1:443 rr
  -> 192.168.47.150:6443          Masq    1      1          0
TCP  10.96.0.10:53 rr
  -> 10.244.1.20:53               Masq    1      0          0
  -> 10.244.2.14:53               Masq    1      0          0

4、LoadBalancer

loadBalancer 和 nodePort 其实是同一种方式。区别在于 loadBalancer 比 nodePort 多了一步，就是可以调用cloud provider 去创建LB来向节点导流（nodePort使用的是nginx等其他）
云服务商收费

5、ExternalName

这种类型的 Service 通过返回 CNAME 和它的值，可以将服务映射到 externalName 字段的内容( 例如：www.baidu.com )。ExternalName Service 是 Service 的特例，它没有 selector，也没有定义任何的端口和Endpoint。相反的，对于运行在集群外部的服务，它通过返回该外部服务的别名这种方式来提供服务
在集群内部访问集群外部的服务

资源清单示例

apiVersion: v1
kind: Service
metadata:
  # 名称externalName-1、externalName1 为什么不合法 不能使用驼峰 只能用-连接单词 并且还要小写
  name: external1
  namespace: default
spec:
  type: ExternalName
  # 连接的外界域名
  externalName: www.baidu.com

#  查看ExternalName类型的service
[root@k8smaster services]# kubectl get svc
NAME             TYPE           CLUSTER-IP      EXTERNAL-IP     PORT(S)        AGE
external1        ExternalName   <none>          www.baidu.com   <none>         15h

当查询主机 my-service.defalut.svc.cluster.local ( SVC_NAME.NAMESPACE.svc.cluster.local )时，集群的DNS 服务将返回一个值 my.database.example.com 的 CNAME 记录。访问这个服务的工作方式和其他的相同，唯一不同的是重定向发生在 DNS 层，而且不会进行代理或转发

6、Multi-Port

可能很多服务需要开发不止一个端口,为了满足这样的情况，Kubernetes允许在定义时候指定多个端口，当我们使用多个端口的时候，我们需要指定所有端口的名称，这样endpoints才能清楚

资源清单示例

apiVersion: v1
kind: Service
metadata:
  name: multiPort
spec:
  type: NodePort
  selector:
    app: myapp
    release: stabel
  ports:
  - name: http
    protocol: TCP
    port: 80
    targetPort: 9376
  - name: https
    protocol: TCP
    port: 443
    targetPort: 9377

# 查看service和endpoints
[root@k8smaster services]# kubectl get svc
NAME             TYPE           CLUSTER-IP      EXTERNAL-IP     PORT(S)                      AGE
kubernetes       ClusterIP      10.96.0.1       <none>          443/TCP                      16h

[root@k8smaster services]# kubectl get endpoints
NAME             ENDPOINTS                                                        AGE
multi-port       10.244.1.76:9376,10.244.2.73:9376,10.244.2.74:9376 + 3 more...   48s

7、Endpoints

当我们创建一个service之后，我们可以使用这个service对Pod进行访问，而service是通过标签的选择来确定访问那些Pod，Kubernete提供了一个简单的Endpoints API，这个Endpoints api的作用就是当一个服务中的pod发生变化时，Endpoints API随之变化，对于哪些不是原生的程序，Kubernetes提供了一个基于虚拟IP的网桥的服务，这个服务会将请求转发到对应的后台pod，也就是service和pod的对应关系，通过Endpoints可以找到，当我们创建一个service之后，k8s就会创建一个同名的Endpoints（没有选择器的情况下值为None），ExternalName是没有Endpoints的

资源清单示例

apiVersion: v1
kind: Service
metadata:
  name: myapp1
  namespace: default
spec:
  type: ClusterIP
  # 通过标签来选择pod，需全部满足 当前环境下并没有携带app=myapp1的Pod，也就是该service连接不到任何Pod 所以Endpoints为null
  selector:
    app: myapp1
    release: stabel
  # 暴露端口
  ports:
  - name: http
    # 集群内部使用的端口
    port: 80
    # 转发到其下Pod的容器端口
    targetPort: 80

# 查看service
[root@k8smaster services]# kubectl get svc
NAME             TYPE           CLUSTER-IP      EXTERNAL-IP     PORT(S)                      AGE
multi-port       NodePort       10.102.72.19    <none>          80:31277/TCP,443:31584/TCP   11s
myapp1           ClusterIP      10.102.0.48     <none>          80/TCP                       17m

# 查看endpoints 发现myapp1的为<none> 前面的Ip为Pod的ip，端口为targetPort
[root@k8smaster services]# kubectl get endpoints -o wide
NAME             ENDPOINTS                                                        AGE
multi-port       10.244.1.76:9376,10.244.2.73:9376,10.244.2.74:9376 + 3 more...   63s
myapp1           <none>                                                           18m

# 查看pod 发现和endpoints中的ip一致
[root@k8smaster services]# kubectl get pod -o wide
NAME                            READY   STATUS    RESTARTS   AGE   IP            NODE       NOMINATED NODE   READINESS GATES
myapp-deploy-7c4dbc97b9-7cdzf   1/1     Running   0          16h   10.244.2.74   k8snode1   <none>           <none>
myapp-deploy-7c4dbc97b9-k44kg   1/1     Running   0          16h   10.244.2.73   k8snode1   <none>           <none>
myapp-deploy-7c4dbc97b9-lglrv   1/1     Running   0          16h   10.244.1.76   k8snode2   <none>           <none>

这种情况下，我们需要手动创建Endpoints，将service和Pod进行关联

资源清单示例

apiVersion: v1
kind: Endpoints
metadata:
  # 连接到的servcie名称 如果没有该service，会创建一个新的service 不会对原来的service进行更新
  name: myapp1
subsets:
# 连接Pod的Ip和port 外部的也可以
- addresses:
  - ip: 10.244.2.74
  ports:
  - port: 80

# 创建endpoints 并查看
[root@k8smaster services]# kubectl apply -f myapp1endpoints.yaml
Warning: kubectl apply should be used on resource created by either kubectl create --save-config or kubectl apply
endpoints/myapp1 configured

# 发现名为myapp1 的endpoints的ENDPOINTS 不在为<none> 为我们设置的值
[root@k8smaster services]# kubectl get endpoints
NAME             ENDPOINTS                                                        AGE
multi-port       10.244.1.76:9376,10.244.2.73:9376,10.244.2.74:9376 + 3 more...   63m
myapp1           10.244.2.74:80                                                   80m

8、service转发

我们使用上述NodePort的资源清单创建service 查看其转发规则
这就说明了创建NodePort的service，使用任意node:端口都能访问的原因（包含master），在每个node上都开启了该端口

# 创建service
[root@k8smaster services]# kubectl apply -f nodeport.yaml
service/myapp-nodeport created

# 查看service
[root@k8smaster services]# kubectl get svc
NAME             TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)        AGE
kubernetes       ClusterIP   10.96.0.1       <none>        443/TCP        53s
myapp-nodeport   NodePort    10.109.117.16   <none>        80:30001/TCP   10s

# 查看service ipvs的转发 ipvsadm -Ln
# 可以发现使用本机IP和127.0.0.1的30001端口 都会转发到任意Pod的80端口上
# 使用CLUSTER-IP:80 都会转发到任意Pod的80端口上
[root@k8smaster services]# ipvsadm -Ln
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
  -> RemoteAddress:Port           Forward Weight ActiveConn InActConn
  
TCP  192.168.47.150:30001 rr
  -> 10.244.1.76:80               Masq    1      0          0
  -> 10.244.2.73:80               Masq    1      0          0
  -> 10.244.2.74:80               Masq    1      0          0

TCP  10.109.117.16:80 rr
  -> 10.244.1.76:80               Masq    1      0          0
  -> 10.244.2.73:80               Masq    1      0          0
  -> 10.244.2.74:80               Masq    1      0          0

TCP  127.0.0.1:30001 rr
  -> 10.244.1.76:80               Masq    1      0          0
  -> 10.244.2.73:80               Masq    1      0          0
  -> 10.244.2.74:80               Masq    1      0          0
  
UDP  10.96.0.10:53 rr
  -> 10.244.1.20:53               Masq    1      0          0
  -> 10.244.2.14:53               Masq    1      0          0

# 还可以使用netstat -ano | grep 30001 查看

posted @ 2020-12-25 16:55 xiaokantianse 阅读(690) 评论(0) 编辑收藏举报

刷新页面返回顶部

xiaokantianse

2.k8sPod、控制器、service

一、Pod生命周期

1、init c

2、init c的作用

3、特殊说明

4、init c资源清单示例

5、健康检查（探针）

6、start和stop

7、pod状态

二、控制器

1、Replication Controller(RC)

2、ReplicaSet(RS)

3、Deployment

4、DaemonSet

5、StatefulSet

6、Job

7、CronJob

三、Service

1、ClusterIp

2、Headless

3、NodePort

4、LoadBalancer

5、ExternalName

6、Multi-Port

7、Endpoints

8、service转发

公告