Kubenetes初始化集群
安装k8s三驾马车,在虚拟机上创建初始化集群,踩了很多坑,终于找到一个保姆级教程,赶紧记录保存下来。
原文链接地址:
https://www.cnblogs.com/Sunzz/p/15184167.html
一、安装环境说明
硬件要求
内存:2GB或更多RAM
CPU: 2核CPU或更多CPU
硬盘: 30GB或更多
本次环境说明:
操作系统: CentOS 7
内核版本: 3.10.0-1160
master: 192.168.174.101
node01: 192.168.174.102
node02: 192.168.174.103
因为使用的是虚拟机,所以设置静态IP:
1.输入 vim /etc/sysconfig/network-scripts/ifcfg-ens33
查看网卡信息
2.BOOTPROTO=dhcp
表示每次关闭linux系统在重新启动之后都会重新获得新的ip地址。
所以需要将dhcp修改为static,修改后为BOOTPROTO=static
。
同时将获取ip地址的方式改为静态获取之后,需要在下面配置 IP地址,网关,子网掩码。
配置之后如下图:
接下来切换到命令行模式:保存退出esc,:wq。
3.返回到根目录 输入service network restart
命令重启网卡
4.关上linux在启动你的ip地址就不会发生变化了。
二、环境准备
1.关闭防火墙和selinux
关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
iptables -F
关闭selinux
修改vi /etc/selinux/config
将其中的SELINUX=enforcing
改为SELINUX=disabled
2. 关闭swap分区
临时关闭
sudo swapoff -a
永久关闭swap
sudo sed -ri 's/.*swap.*/#&/' /etc/fstab
3.修改hosts文件
设置主机名(不设置也可以,但是要保证主机名不相同)
master上
hostnamectl set-hostname master.local
node01
hostnamectl set-hostname node01.local
node02
hostnamectl set-hostname node02.local
修改本地hosts文件
sudo vi /etc/hosts 添加如下内容
192.168.174.101 master.local
192.168.174.102 node01.local
192.168.174.103 node02.local
4.修改内核参数
su
改为管理员权限
sudo cat > /etc/sysctl.d/k8s.conf << EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
net.ipv4.ip_forward = 1
EOF
sysctl --system
5.加载ip_vs内核模块
如果kube-proxy 模式为ip_vs则必须加载,本文采用iptables
modprobe ip_vs
modprobe ip_vs_rr
modprobe ip_vs_wrr
modprobe ip_vs_sh
modprobe nf_conntrack_ipv4
设置下次开机自动加载
cat > /etc/modules-load.d/ip_vs.conf << EOF
ip_vs
ip_vs_rr
ip_vs_wrr
ip_vs_sh
nf_conntrack_ipv4
EOF
三、安装docker
1.配置yum源(这里使用阿里云的源)
yum install wget -y
wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
如果次数报错:正在解析主机 mirrors.aliyun.com (mirrors.aliyun.com)... 失败:未知的名称
解决方法 :
登录root用户,用vim /etc/resolv.conf
,打开rsolv.conf,添加DNS地址
nameserver 8.8.8.8
nameserver 8.8.4.4
nameserver 223.5.5.5
nameserver 223.6.6.6
2. 安装docker
yum install docker-ce docker-ce-cli -y
如果次数报错:更新yum源
yum update
安装指定版本的docker
列出所有docker版本
yum list docker-ce.x86_64 --showduplicates |sort
选择一个你想要的版本进行安装,这里安装docker 19.03.9版本
yum -y install docker-ce-19.03.9-3.el7 docker-ce-cli-19.03.9-3.el7
3.编辑docker配置文件
新建/etc/docker/daemon.json
mkdir /etc/docker/
cat > /etc/docker/daemon.json << EOF
{
"registry-mirrors": ["https://gqs7xcfd.mirror.aliyuncs.com","https://hub-mirror.c.163.com"],
"exec-opts": ["native.cgroupdriver=systemd"],
"log-driver": "json-file",
"log-opts": {
"max-size": "100m"
},
"storage-driver": "overlay2"
}
EOF
4.启动docker服务
systemctl daemon-reload && systemctl enable docker && systemctl start docker
四、安装kubeadm,kubelet和kubectl
1.配置yum源(这里使用阿里云的源)
cat > /etc/yum.repos.d/kubernetes.repo << EOF
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF
2.安装指定版本的kubeadm,kubelet,kubectl
由于官网未开放同步方式, 可能会有索引gpg检查失败的情况, 这时请用 sudo yum install -y --nogpgcheck kubelet kubeadm kubectl
安装 (su权限下)
现在的版本更新了,要指定版本
yum install -y kubelet-1.23.5 kubeadm-1.23.5 kubectl-1.23.5
3.设置开机自启
systemctl enable kubelet
4.列出所有版本
yum list kubelet --showduplicates
五、部署Kubernetes Master节点(只在Master01中)
1.master节点初始化
kubeadm init \
--kubernetes-version 1.23.5 \
--apiserver-advertise-address=0.0.0.0 \
--service-cidr=10.96.0.0/16 \
--pod-network-cidr=10.245.0.0/16 \
--image-repository registry.aliyuncs.com/google_containers
参数说明
--kubernetes-version v1.23.5 指定版本
--apiserver-advertise-address 为通告给其它组件的IP,一般应为master节点的IP地址
--service-cidr 指定service网络,不能和node网络冲突
--pod-network-cidr 指定pod网络,不能和node网络、service网络冲突
--image-repository registry.aliyuncs.com/google_containers 指定镜像源,由于默认拉取镜像地址k8s.gcr.io国内无法访问,这里指定阿里云镜像仓库地址。
如果k8s版本比较新,可能阿里云没有对应的镜像,就需要自己从其它地方获取镜像了。
--control-plane-endpoint 标志应该被设置成负载均衡器的地址或 DNS 和端口(可选)
注意:版本必须和上边安装的kubelet,kubead,kubectl保持一致
2.等待拉取镜像
也可用自己提前给各个节点拉取镜像 ,查看所需镜像命令: kubeadm --kubernetes-version 1.18.8 config images list
等待镜像拉取成功后,会继续初始化集群,等到初始化完成后,会看到类似如下信息,
保存最后两行的输出,后边会用到:
3. 配置kubectl
就是执行初始化成功后输出的那三条命令
mkdir -p $HOME/.kube
cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
chown $(id -u):$(id -g) $HOME/.kube/config
4.查看节点信息
kubectl get nodes
此时只能看到master节点,等待其他节点加入进来后即可看到。
六、node节点加入集群(在 Node01 和 Node02 上)
各个node节点也要进行 二三四 步骤的操作,然后才能加入集群
1. node01 加入集群
kubeadm join 192.168.174.142:6443 --token ljgz9f.onoxgez429g29dt2 \
--discovery-token-ca-cert-hash sha256:290598fbbcfc727b2490c59680e4e7278dc1b3fa13323f9a27c3486949f9855d
注意:此时如果添加节点不成功,可能是由于master的token只能24小时有效,需要重新生成
token
2. node02进行相同的操作即可,这里不再赘述
3.master节点上查看集群节点
kubectl get nodes
可以看到 STATUS状态都是NotReady, 这是因为缺少网络插件导致的,等安装好网络插件就好了
七、安装插件
1.安装 flannel
从官网下载kube-flannel.yml文件
wget https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
或者复制下面
---
apiVersion: policy/v1beta1
kind: PodSecurityPolicy
metadata:
name: psp.flannel.unprivileged
annotations:
seccomp.security.alpha.kubernetes.io/allowedProfileNames: docker/default
seccomp.security.alpha.kubernetes.io/defaultProfileName: docker/default
apparmor.security.beta.kubernetes.io/allowedProfileNames: runtime/default
apparmor.security.beta.kubernetes.io/defaultProfileName: runtime/default
spec:
privileged: false
volumes:
- configMap
- secret
- emptyDir
- hostPath
allowedHostPaths:
- pathPrefix: "/etc/cni/net.d"
- pathPrefix: "/etc/kube-flannel"
- pathPrefix: "/run/flannel"
readOnlyRootFilesystem: false
# Users and groups
runAsUser:
rule: RunAsAny
supplementalGroups:
rule: RunAsAny
fsGroup:
rule: RunAsAny
# Privilege Escalation
allowPrivilegeEscalation: false
defaultAllowPrivilegeEscalation: false
# Capabilities
allowedCapabilities: ['NET_ADMIN', 'NET_RAW']
defaultAddCapabilities: []
requiredDropCapabilities: []
# Host namespaces
hostPID: false
hostIPC: false
hostNetwork: true
hostPorts:
- min: 0
max: 65535
# SELinux
seLinux:
# SELinux is unused in CaaSP
rule: 'RunAsAny'
---
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1
metadata:
name: flannel
rules:
- apiGroups: ['extensions']
resources: ['podsecuritypolicies']
verbs: ['use']
resourceNames: ['psp.flannel.unprivileged']
- apiGroups:
- ""
resources:
- pods
verbs:
- get
- apiGroups:
- ""
resources:
- nodes
verbs:
- list
- watch
- apiGroups:
- ""
resources:
- nodes/status
verbs:
- patch
---
kind: ClusterRoleBinding
apiVersion: rbac.authorization.k8s.io/v1
metadata:
name: flannel
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: flannel
subjects:
- kind: ServiceAccount
name: flannel
namespace: kube-system
---
apiVersion: v1
kind: ServiceAccount
metadata:
name: flannel
namespace: kube-system
---
kind: ConfigMap
apiVersion: v1
metadata:
name: kube-flannel-cfg
namespace: kube-system
labels:
tier: node
app: flannel
data:
cni-conf.json: |
{
"name": "cbr0",
"cniVersion": "0.3.1",
"plugins": [
{
"type": "flannel",
"delegate": {
"hairpinMode": true,
"isDefaultGateway": true
}
},
{
"type": "portmap",
"capabilities": {
"portMappings": true
}
}
]
}
net-conf.json: |
{
"Network": "10.245.0.0/16",
"Backend": {
"Type": "vxlan"
}
}
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
name: kube-flannel-ds
namespace: kube-system
labels:
tier: node
app: flannel
spec:
selector:
matchLabels:
app: flannel
template:
metadata:
labels:
tier: node
app: flannel
spec:
affinity:
nodeAffinity:
requiredDuringSchedulingIgnoredDuringExecution:
nodeSelectorTerms:
- matchExpressions:
- key: kubernetes.io/os
operator: In
values:
- linux
hostNetwork: true
priorityClassName: system-node-critical
tolerations:
- operator: Exists
effect: NoSchedule
serviceAccountName: flannel
initContainers:
- name: install-cni
image: quay.io/coreos/flannel:v0.14.0
command:
- cp
args:
- -f
- /etc/kube-flannel/cni-conf.json
- /etc/cni/net.d/10-flannel.conflist
volumeMounts:
- name: cni
mountPath: /etc/cni/net.d
- name: flannel-cfg
mountPath: /etc/kube-flannel/
containers:
- name: kube-flannel
image: quay.io/coreos/flannel:v0.14.0
command:
- /opt/bin/flanneld
args:
- --ip-masq
- --kube-subnet-mgr
resources:
requests:
cpu: "100m"
memory: "50Mi"
limits:
cpu: "100m"
memory: "50Mi"
securityContext:
privileged: false
capabilities:
add: ["NET_ADMIN", "NET_RAW"]
env:
- name: POD_NAME
valueFrom:
fieldRef:
fieldPath: metadata.name
- name: POD_NAMESPACE
valueFrom:
fieldRef:
fieldPath: metadata.namespace
volumeMounts:
- name: run
mountPath: /run/flannel
- name: flannel-cfg
mountPath: /etc/kube-flannel/
volumes:
- name: run
hostPath:
path: /run/flannel
- name: cni
hostPath:
path: /etc/cni/net.d
- name: flannel-cfg
configMap:
name: kube-flannel-cfg
更改第 128 行的网络配置,要和 pod-network-cidr 保持一致
nl kube-flannel.yml |grep 128
注意:这里后缀名采用.yml
sudo vim kube-flannel.yml
然后执行yaml文件
kubectl apply -f kube-flannel.yml
2.查看flannel部署结果
kubectl -n kube-system get pods -o wide
3.查看各个node的状态
kubectl get nodes
4. 修改集群kube-proxy的模式为iptables
由于 k8s 1.18对内核版本要求比较高,3.10的内核部署1.18.8使用ipvs模式会存在coredns无法解析等问题。股在此采用iptables模式。 如果你服务内核4+起,则采用iptables 和ipvs均可。
kubectl get cm kube-proxy -n kube-system -o yaml | sed 's/mode: ""/mode: "iptables"/' | kubectl apply -f -
kubectl -n kube-system rollout restart daemonsets.apps kube-proxy
kubectl -n kube-system rollout restart daemonsets.apps kube-flannel-ds
后来发现flannel总出问题
CNI网络插件改为安装calico
kubectl apply -f "http://docs.projectcalico.org/manifests/calico.yaml"