【Kubernetes】K8s笔记(四):从 Job 和 CronJob 看 Kubernetes 的设计理念

0. 前言:在线业务和离线业务

Kubernetes 的业务可以分为两大类:在线业务和离线业务。

  • 在线业务:像 Nginx 、MySQL 这样长时间运行的业务,这些应用一旦运行起来,除非出错或者停止,它的容器进程会一直保持在 Running 状态

  • 离线业务:短时间运行的业务,或者是定时任务,这种业务在计算完成后就直接退出了;它们一般不直接服务于外部用户,只对内部用户有意义,比如日志分析、数据建模、视频转码等等,虽然计算量很大,但只会运行一段时间;也就是说,它们的特点是必定会退出,因此我们需要考虑运行超时、状态检查、失败重试、获取计算结果等管理事项

在上篇中我们也看到了,Kubernetes 基于 Pod 延伸出了很多表示各种业务的其他资源对象。那为什么不直接在 Pod 中添加功能来处理这些业务需求?

这篇笔记会简要阐述 Kubernetes 基于 Pod 的设计理念,也是上面问题的解答。下面先从 Kubernetes 最简单的两种对象 JobCronJob 开始。

1. 不扩展 Pod 功能背后的理念和原则

Kubernetes 使用 YAML 来描述资源,把业务简化成了一个个的对象,内部有属性,外部有联系,也需要互相协作,只不过我们不需要编程,完全由 Kubernetes 自动处理。

面向对象的设计有许多基本原则,其中有两条比较恰当地描述了 Kubernetes 对象设计思路,一个是“单一职责”,另一个是“组合优于继承”

  • 单一职责:对象应该只专注于做好一件事情,保持足够小的粒度才更方便复用和管理

  • 组合优于继承:尽量让对象在运行时产生联系,保持松耦合,而不要用硬编码的方式固定对象的关系

因为 Pod 已经是一个相对完善的对象,专门负责管理容器,那么我们就不应该再“画蛇添足”地盲目为它扩充功能,而是要保持它的独立性,容器之外的功能就需要定义其他的对象,把 Pod 作为它的一个成员“组合”进去。每种 Kubernetes 对象就可以只关注自己的业务领域,只做自己最擅长的事情,其他的工作交给其他对象来处理,既不“缺位”也不“越位”,既有分工又有协作。

2. Job 和 CronJob

“离线业务”也可以分为两种。一种是“临时任务”,运行完成就结束了,如果有需要可以再次安排;另一种是“定时任务”,可以按时按点周期运行,不需要过多干预。为了实现对离线业务的处理,Kubernetes 组合了 Pod 推出两种新的对象 JobCronJob,“临时任务”就是 API 对象 Job,“定时任务”就是 API 对象 CronJob,使用这两个对象women 就能够在 Kubernetes 里调度管理任意的离线业务了。

2.1 使用 YAML 描述 Job

YAML 文件的“头部”:

  • apiVersion: batch/v1
  • kind: Job,这与对象的名字是一致的
  • metadata: 里面仍要有 name 标记名字,也可以用 labels 添加任意的标签

当然我们也可以用 kubectl create 来生成 YAML 模板:

$ kubectl create job echo-job --image=busybox --dry-run=client -o yaml

注意:想要生成 YAML 样板文件的话不能使用 kubectl run,因为 kubectl run 只能创建 Pod,要创建 Pod 以外的其他 API 对象,需要使用命令 kubectl create,再加上对象的类型名

下面是我们生成的 Job 对象的 YAML 文件(修改后的):

apiVersion: batch/v1
kind: Job
metadata:
  creationTimestamp: null
  name: echo-job

spec:
  template:
    spec:
      restartPolicy: OnFailure
      containers:
      - image: busybox
        name: echo-job
        imagePullPolicy: IfNotPresent
        command: ["/bin/echo"]
        args: ["hello", "world"]

可以看出,Job 与 Pod 主要的区别就在 spec 字段里,多了一个 template 字段,然后又是一个 spec

它其实就是在 Job 对象里应用了组合模式,template 字段定义了一个“应用模板”,里面嵌入了一个 Pod,这样 Job 就可以从这个模板来创建出 Pod。

而这个 Pod 因为受 Job 的管理控制,不直接和 apiServer 打交道,也就没必要重复 apiVersion 等“头字段”,只需要定义好关键的 spec,描述清楚容器相关的信息就可以了,可以说是一个“无头部”的 Pod 对象。

apiVersion 字段是 batch/v1,表明它不属于核心对象组(core group),而是属于批处理对象组(batch group)

image

这个 Pod 工作非常简单,在 containers 里写好名字和镜像,command 执行 /bin/echo,输出“hello world”。

因为 Job 业务的特殊性,所以我们还要在 spec 里多加一个字段 restartPolicy,确定 Pod 运行失败时的策略,OnFailure 是失败原地重启容器,而 Never 则是不重启容器,让 Job 去重新调度生成一个新的 Pod。

2.2 在 Kubernetes 里面操作 Job

使用下面的命令来创建 Job:

$ kubectl apply -f job.yml
job.batch/echo-job created

然后我们可以查看 Job、Pod 的状态:

$ kubectl get jobs
NAME       COMPLETIONS   DURATION   AGE
echo-job   1/1           13s        26s
$ kubectl get pods
NAME             READY   STATUS      RESTARTS   AGE
echo-job-vr84n   0/1     Completed   0          29s

因为 Pod 被 Job 管理,它就不会反复重启报错了,而是会显示为 Completed 表示任务完成,而 Job 里也会列出运行成功的作业数量,这里只有一个作业,所以就是 1/1。Pod 被自动关联了一个名字,用的是 Job 的名字(echo-job)再加上一个随机字符串。

最后我们查看一下 Pod 的输出:

$ kubectl logs echo-job-vr84n

Job 在运行结束后,为了方便获取处理结果,不会立即删除。但是积累过多的已完成的 Job 也会消耗系统资源,我们可以使用 ttlSecondsAfterFinished 设置一个保留时限。参阅已完成 Job 的自动清理

2.3 几个离线作业的重要字段

上面我们操作了一个最简单的 Job,其实 Kubernetes 还支持在Job 级别、Pod 级别添加任意的字段来定制业务。

这里是几个控制离线作业的重要字段,其他更详细的信息可以参考 Job 文档

activeDeadlineSeconds - 设置 Pod 运行的超时时间
backoffLimit - 设置 Pod 的失败重试次数
completions - Job 完成需要运行多少个 Pod,默认是 1 个
parallelism - 它与 completions 相关,表示允许并发运行的 Pod 数量,避免过多占用资源

这 4 个字段并不在 template 字段下,而是在 spec 字段下,所以它们是属于 Job 级别的,用来控制模板里的 Pod 对象。

“声明式”的 Job 对象让离线业务的描述变得非常直观,简单的几个字段就可以很好地控制作业的并行度和完成数量,不需要我们去人工监控干预,Kubernetes 把这些都自动化实现了。

2.4 使用 YAML 描述 CronJob

CronJob 是定时任务,在 Kubernetes 中简称 CronJob 为 cj (前面提到过可以通过 kubectl api-resources 命令查看)。下面我们使用命令来创建一个 CronJob 的 YAML 模板,因为是定时任务,在命令行里还需要指定参数 --schedule:

kubectl create cj echo-cj --image=busybox --schedule="" --dry-run=client -o yaml

然后稍微编辑一下,就生成一个描述 CronJob 对象的 YAML 文件:

apiVersion: batch/v1
kind: CronJob
metadata:
  name: echo-cj

spec:
  schedule: '*/1 * * * *'
  jobTemplate:
    spec:
      template:
        spec:
          restartPolicy: OnFailure
          containers:
          - image: busybox
            name: echo-cj
            imagePullPolicy: IfNotPresent
            command: ["/bin/echo"]
            args: ["hello", "world"]

这个 YAML 连续有三个 spec 嵌套层次:

  • 第一个 spec 是 CronJob 自己的对象规格声明

  • 第二个 spec 从属于“jobTemplate”,它定义了一个 Job 对象

  • 第三个 spec 从属于“template”,它定义了 Job 里运行的 Pod

image

除了定义 Job 对象的“jobTemplate”字段之外,CronJob 还有一个新字段就是“schedule”,用来定义任务周期运行的规则。它使用的是标准的 Cron 语法,指定分钟、小时、天、月、周,和 Linux 上的 crontab 是一样的。

出于节约资源的考虑,CronJob 不会无限期地保留已经运行的 Job,它只会保留最近三个执行结果,当然我们也可以用 successfulJobsHistoryLimit 改变保留的数量。参阅 使用 CronJob 运行自动化任务

其余的用法可以参考 CronJob 文档

posted @ 2022-09-30 10:48  joexu01  阅读(223)  评论(0编辑  收藏  举报