Kubernetes(七)数据存储

数据存储

容器的生命周期可能很短,会被频繁地创建和销毁。容器在销毁时,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器的数据,kubernetes引入了Volume的概念。

Volume是Pod中能够被多个container访问的共享目录。它被定义在Pod上,然后被一个Pod里的多个容器挂载到具体的文件目录下。Kubernetes通过Volume实现:

  1. 同一个Pod中不同容器之间的数据共享
  2. 数据的持久化存储。

Volume的生命周期不与Pod中单个container的生命周期相关联。当container终止或重启时,Volume中的数据也不会丢失。

Kubernetes的Volume支持多种类型,常见的有:

  • 简单存储:EmptyDir、HostPath、NFS
  • 高级存储:PV、PVC
  • 配置存储:ConfigMap、Secret

 

1. 基本存储

1.1. EmptyDir

最基础的Volume类型,一个EmptyDir就是Host上的一个空目录。

EmptyDir是在Pod分配到Node时创建的,它的初始内容为空,并且无需指定宿主机上对应的目录文件,因为kubernetes会自动分配一个目录。当Pod销毁时,EmptyDir中的数据也会被永久删除。EmptyDir用途为:

  1. 临时空间,例如用于某些应用程序运行时所需的临时目录,且无需永久保留
  2. 一个容器需要从另一个容器中获取数据的目录(多容器共享目录)

下面演示一个示例:在一个Pod中准备2个容器nginx和busybox,然后声明一个Volume分别挂在2个容器的目录中。Nginx负责向Volume中写日志,busybox中通过命令将日志内容读到控制台。

如下图所示:

 

创建volume-emptydir.yaml

$ cat yamls/volume-emptydir.yaml
apiVersion: v1
kind: Pod
metadata:
   name: volume-emptydir
   namespace: dev
spec:
   containers:
   - name: nginx
     image: nginx:1.17.1
     ports:
     - containerPort: 80
     volumeMounts:
     - name: logs-volume
       mountPath: /var/log/nginx
   - name: busybox
     image: busybox:1.30
     command: ["/bin/sh", "-c", "tail -f /logs/access.log"]
     volumeMounts:
     - name: logs-volume
       mountPath: /logs
   volumes:
   - name: logs-volume
     emptyDir: {}

 

$ cat yamls/volume-emptydir.yaml
apiVersion: v1
# 访问一次nginx服务后,验证输出。volume-emptydir 为pod名,-c指定container
$ kubectl logs -f volume-emptydir -n dev -c busybox
10.0.0.145 - - [02/Mar/2021:12:54:33 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.61.1" "-"

 

1.2. HostPath

EmptyDir中数据不会持久化,它会随着Pod的结束而销毁,如果想简单地将数据持久化到主机中,可以选择HostPath

HostPath就是将Node主机中一个实际目录挂载到Pod中,以供Container使用。这样可以保证Pod在被销毁后,数据依然可以保存在Node中。

 

示例:

$ cat yamls/volume-hostpath.yaml
apiVersion: v1
kind: Pod
metadata:
   name: volume-hostpath
   namespace: dev
spec:
   containers:
   - name: nginx
     image: nginx:1.17.1
     ports:
     - containerPort: 80
     volumeMounts:
     - name: logs-volume
       mountPath: /var/log/nginx
   - name: busybox
     image: busybox:1.30
     command: ["/bin/sh", "-c", "tail -f /logs/access.log"]
     volumeMounts:
     - name: logs-volume
       mountPath: /logs
   volumes:
   - name: logs-volume
     hostPath:
       path: /root/logs
       type: DirectoryOrCreate

 

关于type类型的说明:

DirectoryOrCreate     #目录存在就使用,不存在就先创建
Directory                     #目录必须存在
FileOrCreate               #文件存在就使用,不存在就先创建
File                               #文件必须存在
Socket                         #unix套接字必须存在
CharDevice                 #字符设备必须存在
BlockDevice                #块设备必须存在

 

1.3. NFS

HostPath可以解决数据持久化的问题,但是一旦Node节点故障后,Pod转移到其他节点,则又会出现问题。此时需要准备单独的网络存储系统,比较常用的是NFSCIFS

NFS是一个网络文件存储系统,可以搭建一台NFS服务器,然后将Pod中的存储直接连接到NFS系统上。这样无论Pod在节点上怎么转移,只要NodeNFS的对接没问题,数据就能成功访问。

 

2. 高级存储

对于NFS存储,要求用户会搭建NFS系统,并且在yaml里配置nfs。由于kubernetes支持的存储系统有很多,要求客户全部掌握不太现实。为了能够屏蔽底层存储实现的细节,方便用户使用,kubernetes引入了PVPVC两种资源对象。

PVPersistent Volume)是持久化卷的意思,是对底层的共享存储的一种抽象。一般情况下PVkubernetes管理员进行创建和配置,它与底层具体的共享存储技术有关并通过插件完成与共享存储的对接

PVCPersistent Volume Claim)是持久卷声明的意思。是用户对于存储需求的一种声明。也就是说PVC是用户向kubernetes系统发出的一种资源需求申请。

如下图:

对于用户来说,只提存储需求(PVC),专业的具体存储配置细节(PV)由管理员完成。

使用了PVPVC后,工作可以进一步细分:

  • 存储:存储工程师维护
  • PV:kubernetes管理员维护
  • PVC:kubernetes用户维护

 

2.1. PV

PV是存储资源的抽象,资源清单如:

apiVersion: v1
kind: PersistentVolume
metadata:
  name: pv2
spec:
  nfs:                                                        # 存储类型,与底层真正存储对应
  capacity:                                               # 存储能力,目前支持存储空间的设置
    storage: 2Gi
  accessModes:                                      # 访问模式
  storageClassName:                             # 存储类别
  persistentVolumeReclaimPolicy:                # 回收策略

 

PV的关键参数说明:

  • 存储类型
    • 底层实际存储的类型,kubernetes支持多种存储类型,每种存储类型的配置都有所差异
  • 存储能力(capacity)
    • 目前只支持存储空间的设置(storage=1Gi),不过未来可能会加入IOPS、吞吐量等指标
  • 访问模式(accessModes)
    • 用于描述用户应用对存储资源的访问权限,访问权限包括:

    1. ReadWriteOnce(RWO):读写权限,但只能被单个节点挂载
    2. ReadOnlyMany(ROX):只读权限,可以被多个节点挂载
    3. ReadWriteMany(RWX):读写权限,可以被多个节点挂载
  • 回收策略(persistentVolumeReclaimPolicy)
    • 当PV不再被使用后,对其的处理方式,目前支持3种策略:
    1. Retain(保留)保留数据,需要管理员手工清除数据
    2. Recycle(回收)清除PV中的数据,效果相当于执行rm -rf /thevolume/*
    3. Delete(删除)与PV相连的后端存储(例如NFS)完成volume的删除操作,常见于云厂商的存储服务
  • 存储类别
    • PV可以通过storageClassName参数指定一个存储类别
    1. 具有特定类别的PV只能与请求了该类别的PVC进行绑定
    2. 未设定类别的PV只能与不请求任何类别的PVC进行绑定
  • 状态
    • 一个PV的声明周期中,可能会处于4种不同的阶段:
    1. Available(可用):可用状态,还未被任何PVC绑定
    2. Bound(已绑定):表示PV已经被PVC绑定
    3. Released(已释放):表示PVC被删除,但是资源还未被集群重新声明
    4. Failed(失败):表示该PV的自动回收失败

 

下面以NFS作为底层存储进行示例:

# 安装
$ sudo yum install nfs-utils -y

# 创建3个pv
$ mkdir /tmp/data/{pv1,pv2,pv3} -pv
mkdir: created directory ‘/tmp/data/pv1’
mkdir: created directory ‘/tmp/data/pv2’
mkdir: created directory ‘/tmp/data/pv3’

# 将共享目录以读写权限暴露给10.0.0.0/16 网段中所有主机
$ cat /etc/exports
/tmp/data/pv1   10.0.0.0/16(rw,no_root_squash)
/tmp/data/pv2   10.0.0.0/16(rw,no_root_squash)
/tmp/data/pv3   10.0.0.0/16(rw,no_root_squash)

# 重启 nfs 服务
$ sudo systemctl restart nfs

 

创建pv.yaml

$ cat yamls/pv.yaml
apiVersion: v1
kind: PersistentVolume
metadata:
   name: pv1
spec:
   capacity:
      storage: 1Gi
   accessModes:
   - ReadWriteMany
   persistentVolumeReclaimPolicy: Retain
   nfs:
    path: /tmp/data/pv1
    server: 10.0.0.145

---

apiVersion: v1
kind: PersistentVolume
metadata:
  name: pv2
spec:
  capacity:
      storage: 2Gi
  accessModes:
  - ReadWriteMany
  persistentVolumeReclaimPolicy: Retain
  nfs:
   path: /tmp/data/pv2
   server: 10.0.0.145

---

apiVersion: v1
kind: PersistentVolume
metadata:
   name: pv3
spec:
   capacity:
      storage: 3Gi
   accessModes:
   - ReadWriteMany
   persistentVolumeReclaimPolicy: Retain
   nfs:
    path: /tmp/data/pv3
    server: 10.0.0.145
$ kubectl get pv -n dev
NAME   CAPACITY   ACCESS MODES   RECLAIM POLICY   STATUS      CLAIM   STORAGECLASS   REASON   AGE
pv1    1Gi        RWX            Retain           Available                                   11m
pv2    2Gi        RWX            Retain           Available                                   11m
pv3    3Gi        RWX            Retain           Available                                   11m

 

2.2. PVC

PVC 是资源的申请,用来声明对存储空间、访问模式、存储类别需求信息。下面是资源清单文件:

apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: pvc
  namespace: dev
spec:
  accessModes:             # 访问模式
  selector:                      # 采用标签对PV选择
  storageClassName:    # 存储类别
  resources:                    # 请求空间
    requests:
    storage: 5Gi

 

PVC的关键配置参数说明:

  • 访问模式(accessModes)
    • 用于描述用户应用对存储资源的访问权限
  • 选择条件(selector)
    • 通过Label Selector的设置,可使PVC对于系统中已存在的PV进行筛选
  • 存储类别(storageClassName)
    • PVC在定义时可以设定需要的后端存储的类别,只有设置了该class的PV才能被系统选出
  • 资源请求(Resources)
    • 描述对存储资源的请求
       

创建 pvc.yaml,申请pv,这里使用 AWS EKS为例。

对于 AWS EKS,可以使用EBS卷或是EFS作为存储,具体可以参考以下文档:

https://docs.aws.amazon.com/zh_cn/eks/latest/userguide/storage-classes.html

https://docs.aws.amazon.com/zh_cn/eks/latest/userguide/efs-csi.html

 

此处我们使用EFS

#首先部署Amazon EFS CSI 驱动程序
$ kubectl apply -k "github.com/kubernetes-sigs/aws-efs-csi-driver/deploy/kubernetes/overlays/stable/?ref=release-1.0"

# 创建efs,以及efs mount point,可参考:
https://aws.amazon.com/premiumsupport/knowledge-center/eks-persistent-storage/

# 创建 efs pv
$ cat specs/pv.yaml
apiVersion: v1
kind: PersistentVolume
metadata:
  name: efs-pv
spec:
  capacity:
    storage: 1Gi
  volumeMode: Filesystem
  accessModes:
    - ReadWriteMany
  persistentVolumeReclaimPolicy: Retain
  storageClassName: efs-sc
  csi:
    driver: efs.csi.aws.com
    volumeHandle: fs-667ec9fb

$ kubectl get pv
NAME     CAPACITY   ACCESS MODES   RECLAIM POLICY   STATUS      CLAIM   STORAGECLASS   REASON   AGE
efs-pv   1Gi        RWX            Retain           Available           efs-sc                  35s

# 创建 storage class
$ cat specs/storageclass.yaml
kind: StorageClass
apiVersion: storage.k8s.io/v1
metadata:
  name: efs-sc
provisioner: efs.csi.aws.com

# 创建pvc
$ cat yamls/pvc-efs.yaml
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: efs-claim
  namespace: dev
spec:
  accessModes:
    - ReadWriteMany
  storageClassName: efs-sc
  resources:
    requests:
      storage: 1Gi

# 自动绑定到pv
$ kubectl get pvc -n dev
NAME        STATUS   VOLUME   CAPACITY   ACCESS MODES   STORAGECLASS   AGE
efs-claim   Bound    efs-pv   1Gi        RWX            efs-sc         15m

 

下面启动podvolume进行写入

$ cat yamls/pv-pod1.yaml
apiVersion: v1
kind: Pod
metadata:
  name: app1
  namespace: dev
spec:
  containers:
  - name: app1
    image: busybox
    command: ["/bin/sh"]
    args: ["-c", "while true; do echo $(date -u) >> /data/out1.txt; sleep 5; done"]
    volumeMounts:
    - name: persistent-storage
      mountPath: /data
  volumes:
  - name: persistent-storage
    persistentVolumeClaim:
      claimName: efs-claim

$ kubectl get pods -n dev
NAME   READY   STATUS    RESTARTS   AGE
app1   1/1     Running   0          55s

# 验证
$ kubectl exec -it app1 -n dev -- /bin/sh

cat /data/out1.txt
Mon Mar 8 04:17:44 UTC 2021
Mon Mar 8 04:17:49 UTC 2021

 

删除 pvc 后,pv的状态为 Released,此状态并不可用,无法用于新的pvc

 

2.3. 生命周期

PVC PV 是一一对应的,PVPVC之间的相互作用遵循以下生命周期:

  • 资源供应:管理员手动创建底层存储和PV
  • 资源绑定:用户创建PVC,kubernetes负责根据PVC的声明去寻找PV并绑定。系统会根据PVC对存储资源的请求,在已存在的PV中选择一个满足条件的PV。
    • 一旦找到,就绑定PV与PVC,用户应用即可使用此PVC
    • 若是未找到,PVC则会无限期处于Pending 状态,直到出现一个符合要求的PV
    • PV一旦绑定到某个PVC上,就会被此PVC独占,无法再与其他PVC绑定
  • 资源使用:用户可以在pod中像volume一样使用pvc
    • Pod使用Volume的定义,将PVC挂载到容器内的某个路径进行使用
  • 资源释放:用户删除PVC后释放PV。此PV的状态会转为“Released”,但无法立即与其他PVC进行绑定。通过之前PVC写入的数据可能还被保留在存储设备上,只有在清除之后该PV才能再次被使用
  • 资源回收:kubernetes根据PV设置的回收策略进行资源的回收。只有PV的存储空间完成回收,才能供新的PVC绑定和使用

生命周期如下图所示:

 

3. ConfigMap

ConfigMap是一种特殊的存储卷,主要作用是用于存储配置信息。

$ cat yamls/configmap.yaml
apiVersion: v1
kind: ConfigMap
metadata:
   name: configmap
   namespace: dev
data:
   info:
     username:admin
     password:123456

$ kubectl get configmap -n dev
NAME        DATA   AGE
configmap   1      10s

 

接下来创建一个pod-configmap.yaml,将上面创建的configmap挂载进去。

$ cat yamls/pod-configmap.yaml
apiVersion: v1
kind: Pod
metadata:
   name: pod-configmap
   namespace: dev
spec:
   containers:
   - name: nginx
     image: nginx:1.17.1
     volumeMounts:                                 # 将configmap挂载到目录
     - name: config
       mountPath: /configmap/config
   volumes:                                               # 引用configmap
   - name: config
     configMap:
         name: configmap

$ kubectl get pod -n dev
NAME            READY   STATUS    RESTARTS   AGE
pod-configmap   1/1     Running   0          5s

 

验证:

$ kubectl exec -it pod-configmap -n dev -- /bin/sh
# cd /configmap/config
# ls
info
# cat info
username:admin password:123456#

# 可以看到映射已经成功,每个configmap都映射成了一个目录
# key --> 文件   value --> 配置文件中的内容
# 此时如果更新configmap的内容,容器中的值也会动态更新

 

4. Secret

Kubernetes中,还存在一种与ConfigMap非常类似的对象,称为Secret对象。它主要用于存储敏感信息,例如密码、密钥、证书等。

# 首先使用base64对数据进行编码
$ echo -n 'admin' | base64
YWRtaW4=

$ echo -n '123456' | base64
MTIzNDU2

# 编写secret.yaml
$ cat yamls/secret.yaml
apiVersion: v1
kind: Secret
metadata:
   name: secret
   namespace: dev
type: Opaque
data:
   username: YWRtaW4=
   password: MTIzNDU2

$ kubectl get secret -n dev
NAME                  TYPE                                  DATA   AGE
default-token-lcqxm   kubernetes.io/service-account-token   3      12d
secret                Opaque                                2      31s

 

创建pod验证:

$ cat yamls/pod-secret.yaml
apiVersion: v1
kind: Pod
metadata:
   name: pod-secret
   namespace: dev
spec:
   containers:
   - name: nginx
     image: nginx:1.17.1
     volumeMounts:
     - name: config
       mountPath: /secret/config
   volumes:
   - name: config
     secret:
       secretName: secret

$ kubectl get pods -n dev
NAME         READY   STATUS    RESTARTS   AGE
pod-secret   1/1     Running   0          96s

# 进入pod验证
$ kubectl exec -it pod-secret -n dev -- /bin/sh
# cd secret/config
# ls
password  username

# cat password
123456

 

至此,实现了通过secret 进行编码(仅是编码,并非加密)。

 

 

 

posted @ 2021-03-27 15:48  ZacksTang  阅读(374)  评论(0编辑  收藏  举报