k8s 中 pod 是如何做到网络共享的

前言

在k8s中, pod是编排的最小单位, 在同一个pod中, 容器之间能够共享hostname network 等内容.

共享network, 简单说就是同一个pod中的容器, 可以通过访问localhost互相访问, 且端口占用会冲突.

在之前的介绍中提到过, 容器的隔离是通过namespace技术实现的, 网络隔离自然也是通过Network Namespace 实现. 每个network namespace中都有自己的一套网络资源, 比如: IP地址, 路由表, 网卡等.

那么网络共享的原理, 自然也就是将多个容器加入到同一个network namespace中咯.

令多个容器共用一套network namespace, 在docker中可以这样做:

# 方式一: 创建一个network, 然后所有容器都使用这个网络
docker network create mynetwork
docker run --name container1 --network=mynetwork nginx
docker run --name container2 --network=mynetwork nginx

# 方式二: 启动一个容器, 然后将新的容器加入到已有容器的网络中
docker run --name container1 nginx
docker run --name container2 --network container:container1 nginx

而k8s则是容器的管理者, 它又是怎么选择的呢?

k8s 的网络共享

在k8s中, 选择了第二种方式来共享网络, 不止是网络, 包括volume也是这样. 这样设计可能是为了更大的灵活性吧. 具体原因没有细究.

但是, 如果说我们在启动容器的时候, 要将其加入到已有容器的网络中, pod中的容器就必须有一个是先启动的, 这样后续的容器才能加入. 那么问题来了, pod中哪个容器能够最先启动呢? 难道我们在定义pod时还需要定义容器的启动顺序吗? 显然不是这样的.

那么k8s是如何解决容器启动顺序的问题呢? 处理方式也十分简单粗暴, 在所有容器启动之前, 先启动一个默认的容器, 后续所有容器就可以都加入此容器的命名空间中了. 这个预先启动的容器什么都不做, 只是为了后续容器加入.

pause容器查看#

口说无凭, 我们启动一个pod来看一下:

apiVersion: v1
kind: Pod
metadata:
  name: test
  namespace: hj
spec:
  shareProcessNamespace: true
  restartPolicy: Never
  containers:
    - name: nginx
      image: nginx
    - name: busybox
      image: busybox
      command: ["/bin/sh"]
      args: ["-c", "sleep infinity"]