安装k8s基于containerd

上次安装k8s,3年多了;今天尝试再安装一次k8s,不同的是这次不再用docker,改为containerd。
得益于以前写的ansible脚本,很有参考价值,虽然3年多过去了,很多东西还对得上。

一、前期准备

1、网络规划

本次安装开发环境,配置1个Master节点,2个Worker节点,在安装的时候即可配置好。

节点 主机名 IP
Master k8s-master 192.168.2.231/22
Worker1 k8s-worker1 192.168.2.232/22
Worker2 k8s-worker2 192.168.2.233/22

2、安装基础工具

可选步骤,个人喜好

1
sudo yum install -y vim telnet wget unzip epel-release

3、关闭系统功能

所有节点都执行

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
# 关闭防火墙
sudo systemctl stop firewalld
sudo systemctl disable firewalld

# 关闭SELINUX
sudo setenforce 0

sudo vim /etc/selinux/config
# SELINUX=disabled

# 关闭swap
sudo swapoff -a

# 注释交换分区的挂载
sudo vim /etc/fstab

# 配置网桥
sudo vim /etc/sysctl.conf

net.bridge.bridge-nf-call-ip6tables	= 1
net.bridge.bridge-nf-call-iptables     = 1
net.ipv4.ip_forward                 = 1
vm.swappiness                         = 0

# 加载以下2个模块(root用户)
cat << EOF > /etc/modules-load.d/k8s.conf
ip_vs_rr # 不确定这个是否还需要,待验证
br_netfilter
EOF

# 生效配置
sysctl -p
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
# 安装时间同步服务,确保三台服务器时间准确
sudo yum -y install chrony
sudo systemctl start chronyd
sudo systemctl enable chronyd

# 修改hosts
sudo vim /etc/hosts
192.168.2.231 k8s-master
192.168.2.232 k8s-worker1
192.168.2.233 k8s-worker2

二、安装containerd

所有节点都执行

1、下载安装

1
2
3
wget https://github.com/containerd/containerd/releases/download/v1.7.8-linux-amd64.tar.gz

sudo tar Cxzvf /usr/local containerd-1.7.8-linux-amd64.tar.gz

2、修改配置

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
sudo mkdir /etc/containerd
containerd config default | sudo tee -a /etc/containerd/config.toml
sudo vim /etc/containerd/config.toml

#SystemdCgroup的值改为true
[plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc]
  ...
  [plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc.options]
    SystemdCgroup = true

#由于国内下载不到registry.k8s.io的镜像,修改sandbox_image的值为:
sandbox_image = "registry.aliyuncs.com/google_containers/pause:3.8"

3、启动服务

1
2
3
4
5
6
7
wget https://raw.githubusercontent.com/containerd/containerd/main/containerd.service

sudo mkdir -p /usr/lib/systemd/system
sudo mv containerd.service /usr/lib/systemd/system

sudo systemctl daemon-reload
sudo systemctl enable --now containerd

4、验证

1
ctr version

三、安装runc

所有节点都执行

下载地址:https://github.com/opencontainers/runc/releases

1
sudo install -m 755 runc.amd64 /usr/local/sbin/runc

四、安装CNI插件

所有节点都执行

下载地址:https://github.com/containernetworking/plugins/releases

1
2
sudo mkdir -p /opt/cni/bin
sudo tar Cxzvf /opt/cni/bin cni-plugins-linux-amd64-v1.3.0.tgz

五、安装集群

所有节点都执行

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
# 添加阿里云的kubernetes源:/etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg

# 安装最新版
sudo yum install -y kubeadm kubelet kubectl

# 开机自启动
sudo systemctl enable kubelet

# 验证安装
kubeadm version

六、初始化集群

仅Master节点执行

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
sudo kubeadm init --apiserver-advertise-address 192.168.2.231 --image-repository registry.aliyuncs.com/google_containers --kubernetes-version v1.28.3 --pod-network-cidr=10.244.0.0/16

# 参数说明
# API Server广播地址
--apiserver-advertise-address 192.168.2.231
# 指定镜像地址使用阿里云的,默认会使用谷歌镜像
--image-repository registry.aliyuncs.com/google_containers
# 指定当前的kubernetes的版本
--kubernetes-version v1.28.3
# flannel网络的固定地址范围
--pod-network-cidr=10.244.0.0/16

执行完成后,根据提示配置.kube/config,照抄指令,略!

七、安装网络插件flannel

仅Master节点执行

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
# 下载安装文件
wget https://github.com/flannel-io/flannel/releases/latest/download/kube-flannel.yml

# 安装网络插件
kubectl apply -f kube-flannel.yml

# 验证
kubectl get node
kubectl get cs
kubectl get ns
kubectl get pods -n kube-flannel

八、加入集群

Worker节点执行

1
2
3
4
5
6
7
# 加入集群
sudo kubeadm join 192.168.2.231:6443 --token ******************** \
	--discovery-token-ca-cert-hash sha256:******************************************************************

# 验证
# master节点
kubectl get nodes

修改配置,允许拉取http仓库镜像(开发环境一般没有配HTTPS)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
# 创建配置文件路径
sudo mkdir -p /etc/containerd/certs.d/<ip>:<port>

# 编辑配置文件
sudo vim /etc/containerd/certs.d/<ip>:<port>/hosts.toml

server = "http://<ip>:<port>"

[host."http://<ip>:<port>"]
  capabilities = ["pull", "resolve", "push"]
  skip_verify = true

sudo systemctl restart containerd

九、安装crictl工具

可选,下载地址:https://github.com/kubernetes-sigs/cri-tools

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
# 解压安装
sudo tar zxvf crictl-v1.28.0-linux-amd64.tar.gz -C /usr/local/bin

# 创建配置文件:/etc/crictl.yaml
runtime-endpoint: unix:///run/containerd/containerd.sock
image-endpoint: unix:///run/containerd/containerd.sock
timeout: 2
debug: false
pull-image-on-create: false
disable-pull-on-run: false

# 验证
crictl pods

遗留问题

一、/run/containerd/containerd.sock一直报没有权限,不确定原因,需要手动添加权限:sudo usermod -aG root $USER

二、执行kubeadm initkubeadm join一直报错:

1
2
3
4
5
[preflight] Running pre-flight checks
error execution phase preflight: [preflight] Some fatal errors occurred:
  [ERROR FileContent--proc-sys-net-bridge-bridge-nf-call-iptables]: /proc/sys/net/bridge/bridge-nf-call-iptables does not exist
[preflight] If you know what you are doing, you can make a check non-fatal with `--ignore-preflight-errors=...`
To see the stack trace of this error execute with --v=5 or higher

再次运行以下指令解决:

1
2
sudo modprobe ip_vs_rr
sudo modprobe br_netfilter

以上指令重启即失效?

2024-06-11:该问题已解决!!!因为本次安装,没有校对之前写的Ansible脚本,这2项配置(ip_vs_rr可能现在不需要了),需要写进配置文件,否则重启失效(步骤1.3已更新)!该问题导致的后果是:相同节点上的服务,无法相互调用。

参考