k8s 集群部署流程 – Pingk的小世界

1. 系统要求

安装 Kubernetes 对系统软件和硬件的要求如下表：

软硬件	最低配置	推荐配置
主机资源	若集群中有1~5个 node，则要求如下: Master：至少 2 core CPU 和 2GB内存。 Node：至少1 core CPU和内存。	Master：4 core CPU 和 16GB内存。 Node：根据需要运行的容器数量进行配置。
Linux	各种 Linux 发行版，包括 Red Hat Linux、CentOS、Fedora、Ubuntu、Debian 等，Kernel 版本要求在 V3.10 及以上
etcd	版本为 v3 及以上	etcd v3 及以上
容器引擎	Kubernetes 支持的容器引擎包括containerd、CRI-O 等。	containerd 1.7 及以上

Kubernetes 集群各组件端口号：

组件	默认端口号
API Server	6443
Controller Manager	10257
Scheduler	10259
kubelet	10250 10255（只读端口号）
etcd	2379（供客户端访问） 2380（供 etcd 集群内节点之间访问）
集群的 DNS 服务	53（UDP） 53（TCP）

2. etcd 数据库高可用的两种部署方案

2.1 Stacked etcd topology（堆叠式 etcd 拓扑结构）

在 Stacked etcd topology 中，etcd 数据库与 Kubernetes 控制平面组件（如 API 服务器、调度器、控制器管理器）运行在同一台物理机或虚拟机上。

优点：

简单易部署：etcd 与其他控制平面组件运行在同一节点上，部署简单。
节省资源：：该集群 etcd 成员与主节点在相同节点，相对于外部 etcd 服务集群，该方案需要的主机数量少。

缺点：

耦合程度高：如果某一个主节点故障，其上的管理组件 kube-apiserver、kubescheduler、kube-controller-manager 挂掉了，同时该节点上的 etcd 也一起挂掉了。
性能瓶颈：etcd 与其他控制平面组件共享资源，可能导致性能瓶颈。

2.2 External etcd topology（外部 etcd 拓扑结构）

在 External etcd topology 中，etcd 数据库运行在独立的节点或集群中，与 Kubernetes 控制平面组件分开部署。这种部署方式可以提高 etcd 数据库的可靠性和性能。

优点：

解耦合：独立部署 etcd 集群，提高了 etcd 数据库的可靠性。
性能优化：etcd 集群可以专注于存储数据，提高性能。

缺点：

部署复杂：需要额外的节点或集群来运行 etcd，部署和管理相对复杂。

3. 本案例部署规划

节点角色	IP地址
k8s-master-01 nginx+keepalived+etcd	192.168.2.151
k8s-master-02 nginx+keepalived+etcd	192.168.2.152
k8s-master-03 nginx+keepalived+etcd	192.168.2.153
k8s-node-01	192.168.2.154
k8s-node-02	192.168.2.155

nginx+keepalived 对外提供的VIP地址为：192.168.2.150

4. 准备工作

4.1 配置静态 IP

准备需要的主机，分别配置上表所述静态 IP 地址。

4.2 修改主机名及解析（所有节点）

所有主机修改主机名：

hostnamectl set-hostname k8s-master-01
...

hostnamectl set-hostname k8s-master-01
...

ShellScript

所有主机添加解析：

cat >> /etc/hosts <<EOF
192.168.2.150 api-server
192.168.2.151 k8s-master-01
192.168.2.152 k8s-master-02
192.168.2.153 k8s-master-03
192.168.2.154 k8s-node-01
192.168.2.155 k8s-node-02
EOF

cat >> /etc/hosts <<EOF
192.168.2.150 api-server
192.168.2.151 k8s-master-01
192.168.2.152 k8s-master-02
192.168.2.153 k8s-master-03
192.168.2.154 k8s-node-01
192.168.2.155 k8s-node-02
EOF

ShellScript

4.3 禁用一些服务（所有节点）

禁用 SELinux

# 修改操作系统的 /etc/selinux/config 或 /etc/sysconfig/selinux 文件中的 SELINUX=enforcing 为 SELINUX=disabled
# /etc/selinux/config中的配置优先级高于/etc/sysconfig/selinux。如果两个文件中存在相同的配置项，系统会优先采用/etc/selinux/config中的设置
sed -i 's#enforcing#disabled#g' /etc/selinux/config

# 临时关闭 SELinux
setenforce 0

# 修改操作系统的 /etc/selinux/config 或 /etc/sysconfig/selinux 文件中的 SELINUX=enforcing 为 SELINUX=disabled
# /etc/selinux/config中的配置优先级高于/etc/sysconfig/selinux。如果两个文件中存在相同的配置项，系统会优先采用/etc/selinux/config中的设置
sed -i 's#enforcing#disabled#g' /etc/selinux/config

# 临时关闭 SELinux
setenforce 0

ShellScript

配置防火墙

# 在防火墙配置 k8s 各个组件的相互通信的端口号

# 在安全的网络环境下可以关闭防火墙
systemctl stop firewalld
systemctl disable firewalld

# 在防火墙配置 k8s 各个组件的相互通信的端口号

# 在安全的网络环境下可以关闭防火墙
systemctl stop firewalld
systemctl disable firewalld

ShellScript

关闭 swap 分区

# 临时关闭
swapoff -a

# 永久关闭
cp /etc/fstab /etc/fstab_bak
sed -i '/swap/d' /etc/fstab


# ubuntu系统除上述步骤还需要以下步骤
systemctl list-unit-files --type=swap 

UNIT FILE     STATE     VENDOR PRESET
dev-sda3.swap generated -            

1 unit files listed.

systemctl mask dev-sda3.swap
reboot

# 临时关闭
swapoff -a

# 永久关闭
cp /etc/fstab /etc/fstab_bak
sed -i '/swap/d' /etc/fstab


# ubuntu系统除上述步骤还需要以下步骤
systemctl list-unit-files --type=swap 

UNIT FILE     STATE     VENDOR PRESET
dev-sda3.swap generated -            

1 unit files listed.

systemctl mask dev-sda3.swap
reboot

ShellScript

4.4 同步集群时间

# 时间同步方案：采用 k8s-master-01 为内网集群 ntp 服务端，与公网 ntp 服务器同步时间。其他节点与 k8s-master-01 同步时间
# ps: 如果遇到服务器时间不同步无法安装软件，可以先手动设置时间
date -s "2024-7-30 12:17:00"

# 安装 chrony
yum -y install chrony
# ubuntu 系统安装，配置文件路径 /etc/chrony/chrony.conf
apt -y install chrony


# 修改配置文件
## centos：
mv /etc/chrony.conf /etc/chrony.conf.bak
cat > /etc/chrony.conf << EOF
server ntp1.aliyun.com iburst minpoll 4 maxpoll 10
server ntp2.aliyun.com iburst minpoll 4 maxpoll 10
server ntp3.aliyun.com iburst minpoll 4 maxpoll 10
server ntp4.aliyun.com iburst minpoll 4 maxpoll 10
server ntp5.aliyun.com iburst minpoll 4 maxpoll 10
server ntp6.aliyun.com iburst minpoll 4 maxpoll 10
server ntp7.aliyun.com iburst minpoll 4 maxpoll 10
driftfile /var/lib/chrony/drift
makestep 10 3
rtcsync
allow 0.0.0.0/0
local stratum 10
keyfile /etc/chrony.keys
logdir /var/log/chrony
stratumweight 0.05
noclientlog
logchange 0.5
EOF

## ubuntu：
mv /etc/chrony/chrony.conf /etc/chrony/chrony.conf.bak
cat > /etc/chrony/chrony.conf << EOF
server ntp1.aliyun.com iburst minpoll 4 maxpoll 10
server ntp2.aliyun.com iburst minpoll 4 maxpoll 10
server ntp3.aliyun.com iburst minpoll 4 maxpoll 10
server ntp4.aliyun.com iburst minpoll 4 maxpoll 10
server ntp5.aliyun.com iburst minpoll 4 maxpoll 10
server ntp6.aliyun.com iburst minpoll 4 maxpoll 10
server ntp7.aliyun.com iburst minpoll 4 maxpoll 10
driftfile /var/lib/chrony/drift
makestep 10 3
rtcsync
allow 0.0.0.0/0
local stratum 10
keyfile /etc/chrony/chrony.keys
logdir /var/log/chrony
stratumweight 0.05
noclientlog
logchange 0.5
EOF

# 启动 chronyd 服务
systemctl restart chronyd.service # 最好重启，这样无论原来是否启动都可以重新加载配置
systemctl enable chronyd.service  # 设置开机自启
systemctl status chronyd.service



# 安装 chrony 客户端：在需要与外部同步时间的机器上安装，启动后会自动与你指定的服务端同步时间
# 安装 chrony
yum -y install chrony

# 需改客户端配置文件
## centos：
mv /etc/chrony.conf /etc/chrony.conf.bak
cat > /etc/chrony.conf << EOF
# server 服务端的ip地址或可解析的主机名 iburst
server k8s-master-01 iburst
driftfile /var/lib/chrony/drift
makestep 10 3
rtcsync
local stratum 10
keyfile /etc/chrony.keys
logdir /var/log/chrony
stratumweight 0.05
noclientlog
logchange 0.5
EOF

## ubuntu：
mv /etc/chrony/chrony.conf /etc/chrony/chrony.conf.bak
cat > /etc/chrony/chrony.conf << EOF
# server 服务端的ip地址或可解析的主机名 iburst
server k8s-master-01-C-201 iburst
driftfile /var/lib/chrony/drift
makestep 10 3
rtcsync
local stratum 10
keyfile /etc/chrony/chrony.keys
logdir /var/log/chrony
stratumweight 0.05
noclientlog
logchange 0.5
EOF

# 启动 chronyd 服务
systemctl restart chronyd.service
systemctl enable chronyd.service
systemctl status chronyd.service

# 验证
chronyc sources -v

# 时间同步方案：采用 k8s-master-01 为内网集群 ntp 服务端，与公网 ntp 服务器同步时间。其他节点与 k8s-master-01 同步时间
# ps: 如果遇到服务器时间不同步无法安装软件，可以先手动设置时间
date -s "2024-7-30 12:17:00"

# 安装 chrony
yum -y install chrony
# ubuntu 系统安装，配置文件路径 /etc/chrony/chrony.conf
apt -y install chrony


# 修改配置文件
## centos：
mv /etc/chrony.conf /etc/chrony.conf.bak
cat > /etc/chrony.conf << EOF
server ntp1.aliyun.com iburst minpoll 4 maxpoll 10
server ntp2.aliyun.com iburst minpoll 4 maxpoll 10
server ntp3.aliyun.com iburst minpoll 4 maxpoll 10
server ntp4.aliyun.com iburst minpoll 4 maxpoll 10
server ntp5.aliyun.com iburst minpoll 4 maxpoll 10
server ntp6.aliyun.com iburst minpoll 4 maxpoll 10
server ntp7.aliyun.com iburst minpoll 4 maxpoll 10
driftfile /var/lib/chrony/drift
makestep 10 3
rtcsync
allow 0.0.0.0/0
local stratum 10
keyfile /etc/chrony.keys
logdir /var/log/chrony
stratumweight 0.05
noclientlog
logchange 0.5
EOF

## ubuntu：
mv /etc/chrony/chrony.conf /etc/chrony/chrony.conf.bak
cat > /etc/chrony/chrony.conf << EOF
server ntp1.aliyun.com iburst minpoll 4 maxpoll 10
server ntp2.aliyun.com iburst minpoll 4 maxpoll 10
server ntp3.aliyun.com iburst minpoll 4 maxpoll 10
server ntp4.aliyun.com iburst minpoll 4 maxpoll 10
server ntp5.aliyun.com iburst minpoll 4 maxpoll 10
server ntp6.aliyun.com iburst minpoll 4 maxpoll 10
server ntp7.aliyun.com iburst minpoll 4 maxpoll 10
driftfile /var/lib/chrony/drift
makestep 10 3
rtcsync
allow 0.0.0.0/0
local stratum 10
keyfile /etc/chrony/chrony.keys
logdir /var/log/chrony
stratumweight 0.05
noclientlog
logchange 0.5
EOF

# 启动 chronyd 服务
systemctl restart chronyd.service # 最好重启，这样无论原来是否启动都可以重新加载配置
systemctl enable chronyd.service  # 设置开机自启
systemctl status chronyd.service



# 安装 chrony 客户端：在需要与外部同步时间的机器上安装，启动后会自动与你指定的服务端同步时间
# 安装 chrony
yum -y install chrony

# 需改客户端配置文件
## centos：
mv /etc/chrony.conf /etc/chrony.conf.bak
cat > /etc/chrony.conf << EOF
# server 服务端的ip地址或可解析的主机名 iburst
server k8s-master-01 iburst
driftfile /var/lib/chrony/drift
makestep 10 3
rtcsync
local stratum 10
keyfile /etc/chrony.keys
logdir /var/log/chrony
stratumweight 0.05
noclientlog
logchange 0.5
EOF

## ubuntu：
mv /etc/chrony/chrony.conf /etc/chrony/chrony.conf.bak
cat > /etc/chrony/chrony.conf << EOF
# server 服务端的ip地址或可解析的主机名 iburst
server k8s-master-01-C-201 iburst
driftfile /var/lib/chrony/drift
makestep 10 3
rtcsync
local stratum 10
keyfile /etc/chrony/chrony.keys
logdir /var/log/chrony
stratumweight 0.05
noclientlog
logchange 0.5
EOF

# 启动 chronyd 服务
systemctl restart chronyd.service
systemctl enable chronyd.service
systemctl status chronyd.service

# 验证
chronyc sources -v

ShellScript

4.5 sshd 服务优化

SSH 基本优化

SSH 配置秘钥登录

4.6 优化 Linux 系统

系统更新（所有机器）：

# centos：
## centos 7 已经停止更新维护，需要更换第三方 yum 源
## 安装阿里的 base 与 epel 源
curl -s -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo 
curl -s -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
## 清理旧缓存，并重新缓存
yum clean all 
yum makecache
yum update -y



# ubuntu:
apt update -y
# 完全升级系统（包括内核更新）
apt full-upgrade

# centos：
## centos 7 已经停止更新维护，需要更换第三方 yum 源
## 安装阿里的 base 与 epel 源
curl -s -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo 
curl -s -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
## 清理旧缓存，并重新缓存
yum clean all 
yum makecache
yum update -y



# ubuntu:
apt update -y
# 完全升级系统（包括内核更新）
apt full-upgrade

ShellScript

安装基础常用软件：

sudo yum -y install expect wget jq psmisc vim yum-utils lvm2 bind-utils rsync unzip git


sudo apt -y install expect wget jq psmisc vim software-properties-common lvm2 git ntpdate chrony dnsutils rsync unzip

sudo yum -y install expect wget jq psmisc vim yum-utils lvm2 bind-utils rsync unzip git


sudo apt -y install expect wget jq psmisc vim software-properties-common lvm2 git ntpdate chrony dnsutils rsync unzip

ShellScript

更新 Linux 系统内核：

# centos 7 系统内核版本较低
# 系统内核最好 4.4 版本及以上
wget https://elrepo.org/linux/kernel/el7/x86_64/RPMS/kernel-lt-5.4.274-1.el7.elrepo.x86_64.rpm
wget https://elrepo.org/linux/kernel/el7/x86_64/RPMS/kernel-lt-devel-5.4.274-1.el7.elrepo.x86_64.rpm

# 将下载的内核传送到需要更新内核的主机上的 /opt 目录
for i in hosts_list ; do scp kernel-lt-* $i:/opt; done

# 安装
yum localinstall -y /opt/kernel-lt*
# 调到默认启动
grub2-set-default 0 && grub2-mkconfig -o /etc/grub2.cfg  
# 查看当前默认启动的内核
grubby --default-kernel
 
# 重启系统
reboot

# centos 7 系统内核版本较低
# 系统内核最好 4.4 版本及以上
wget https://elrepo.org/linux/kernel/el7/x86_64/RPMS/kernel-lt-5.4.274-1.el7.elrepo.x86_64.rpm
wget https://elrepo.org/linux/kernel/el7/x86_64/RPMS/kernel-lt-devel-5.4.274-1.el7.elrepo.x86_64.rpm

# 将下载的内核传送到需要更新内核的主机上的 /opt 目录
for i in hosts_list ; do scp kernel-lt-* $i:/opt; done

# 安装
yum localinstall -y /opt/kernel-lt*
# 调到默认启动
grub2-set-default 0 && grub2-mkconfig -o /etc/grub2.cfg  
# 查看当前默认启动的内核
grubby --default-kernel
 
# 重启系统
reboot

ShellScript

增大文件打开数量：

# “*” 表示适用于所有用户
cat > /etc/security/limits.d/k8s.conf <<'EOF' 
* soft nofile 1048576
* hard nofile 1048576
EOF 

# 查看当前用户的软限制和硬限制的文件描述符数
ulimit -Sn 
ulimit -Hn

# “*” 表示适用于所有用户
cat > /etc/security/limits.d/k8s.conf <<'EOF' 
* soft nofile 1048576
* hard nofile 1048576
EOF 

# 查看当前用户的软限制和硬限制的文件描述符数
ulimit -Sn 
ulimit -Hn

ShellScript

修改内核参数：

cat > /etc/sysctl.d/k8s.conf << EOF
net.ipv4.ip_forward = 1
net.bridge.bridge-nf-call-iptables = 1
net.bridge.bridge-nf-call-ip6tables = 1
fs.may_detach_mounts = 1
vm.overcommit_memory=1
vm.panic_on_oom=0
fs.inotify.max_user_watches=89100
fs.file-max=52706963
fs.nr_open=52706963
net.ipv4.tcp_keepalive_time = 600
net.ipv4.tcp.keepaliv.probes = 3
net.ipv4.tcp_keepalive_intvl = 15
net.ipv4.tcp.max_tw_buckets = 36000
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp.max_orphans = 327680
net.ipv4.tcp_orphan_retries = 3
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_max_syn_backlog = 16384
net.ipv4.ip_conntrack_max = 65536
net.ipv4.tcp_max_syn_backlog = 16384
net.ipv4.top_timestamps = 0
net.core.somaxconn = 16384
EOF

# 立即生效
sysctl --system

cat > /etc/sysctl.d/k8s.conf << EOF
net.ipv4.ip_forward = 1
net.bridge.bridge-nf-call-iptables = 1
net.bridge.bridge-nf-call-ip6tables = 1
fs.may_detach_mounts = 1
vm.overcommit_memory=1
vm.panic_on_oom=0
fs.inotify.max_user_watches=89100
fs.file-max=52706963
fs.nr_open=52706963
net.ipv4.tcp_keepalive_time = 600
net.ipv4.tcp.keepaliv.probes = 3
net.ipv4.tcp_keepalive_intvl = 15
net.ipv4.tcp.max_tw_buckets = 36000
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp.max_orphans = 327680
net.ipv4.tcp_orphan_retries = 3
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_max_syn_backlog = 16384
net.ipv4.ip_conntrack_max = 65536
net.ipv4.tcp_max_syn_backlog = 16384
net.ipv4.top_timestamps = 0
net.core.somaxconn = 16384
EOF

# 立即生效
sysctl --system

ShellScript

4.7 配置模块自动加载（所有节点）

# 必须配置此项，否则 kubeadm init 时会直接失败

# centos：
# 这两行命令用于手动加载内核模块
modprobe br_netfilter
modprobe ip_conntrack

# 这个循环的目的是在系统启动时自动执行/etc/sysconfig/modules/目录下的所有模块加载脚本
cat >/etc/rc.sysinit<<EOF
#!/bin/bash
 
for file in /etc/sysconfig/modules/*.modules ; do
[ -x $file ] && $file
done
EOF

echo "modprobe br_netfilter" >/etc/sysconfig/modules/br_netfilter.modules
echo "modprobe ip_conntrack" >/etc/sysconfig/modules/ip_conntrack.modules
chmod 755 /etc/sysconfig/modules/br_netfilter.modules
chmod 755 /etc/sysconfig/modules/ip_conntrack.modules



# RockyLinux：
# 可以通过编辑/etc/modules-load.d/目录中的配置文件来实现在系统启动时自动加载内核模块
cat >/etc/modules-load.d/custom-modules.conf<<EOF
br_netfilter
ip_conntrack
EOF
# 重启系统



# ubuntu：
# 可以通过编辑/etc/modules文件来实现在系统启动时自动加载内核模块
cat >> /etc/modules <<EOF
br_netfilter
ip_conntrack
EOF
# 重启系统


# 查看内核模块是否加载成功
lsmod | grep br_netfilter

# 必须配置此项，否则 kubeadm init 时会直接失败

# centos：
# 这两行命令用于手动加载内核模块
modprobe br_netfilter
modprobe ip_conntrack

# 这个循环的目的是在系统启动时自动执行/etc/sysconfig/modules/目录下的所有模块加载脚本
cat >/etc/rc.sysinit<<EOF
#!/bin/bash
 
for file in /etc/sysconfig/modules/*.modules ; do
[ -x $file ] && $file
done
EOF

echo "modprobe br_netfilter" >/etc/sysconfig/modules/br_netfilter.modules
echo "modprobe ip_conntrack" >/etc/sysconfig/modules/ip_conntrack.modules
chmod 755 /etc/sysconfig/modules/br_netfilter.modules
chmod 755 /etc/sysconfig/modules/ip_conntrack.modules



# RockyLinux：
# 可以通过编辑/etc/modules-load.d/目录中的配置文件来实现在系统启动时自动加载内核模块
cat >/etc/modules-load.d/custom-modules.conf<<EOF
br_netfilter
ip_conntrack
EOF
# 重启系统



# ubuntu：
# 可以通过编辑/etc/modules文件来实现在系统启动时自动加载内核模块
cat >> /etc/modules <<EOF
br_netfilter
ip_conntrack
EOF
# 重启系统


# 查看内核模块是否加载成功
lsmod | grep br_netfilter

ShellScript

4.8 安装 IPVS（所有节点）

# centos：
# 安装 ipvsadm 等相关工具
yum -y install ipvsadm ipset sysstat conntrack libseccomp 

# 配置加载
cat > /etc/sysconfig/modules/ipvs.modules << "EOF"
#!/bin/bash 
ipvs_modules="ip_vs ip_vs_lc ip_vs_wlc ip_vs_rr ip_vs_wrr ip_vs_lblc ip_vs_lblcr 
ip_vs_dh ip_vs_sh ip_vs_fo ip_vs_nq ip_vs_sed ip_vs_ftp nf_conntrack" 
for kernel_module in ${ipvs_modules}; 
do 
    /sbin/modinfo -F filename ${kernel_module} > /dev/null 2>&1 
    if [ $? -eq 0 ]; then 
        /sbin/modprobe ${kernel_module} 
    fi 
done 
EOF

chmod 755 /etc/sysconfig/modules/ipvs.modules && bash /etc/sysconfig/modules/ipvs.modules && lsmod | grep ip_vs



# RockyLinux：
yum -y install ipvsadm ipset sysstat conntrack libseccomp
cat > /etc/modules-load.d/ipvs.conf <<EOF
ip_vs
ip_vs_lc
ip_vs_wlc
ip_vs_rr
ip_vs_wrr
ip_vs_lblc
ip_vs_lblcr
ip_vs_dh
ip_vs_sh
ip_vs_fo
ip_vs_nq
ip_vs_sed
ip_vs_ftp
nf_conntrack 
EOF



# ubuntu：
apt install -y ipvsadm ipset sysstat conntrack libseccomp2
cat >> /etc/modules <<EOF
# IPVS 相关模块
ip_vs
ip_vs_lc
ip_vs_wlc
ip_vs_rr
ip_vs_wrr
ip_vs_lblc
ip_vs_lblcr
ip_vs_dh
ip_vs_sh
ip_vs_fo
ip_vs_nq
ip_vs_sed
ip_vs_ftp
nf_conntrack
EOF

# centos：
# 安装 ipvsadm 等相关工具
yum -y install ipvsadm ipset sysstat conntrack libseccomp 

# 配置加载
cat > /etc/sysconfig/modules/ipvs.modules << "EOF"
#!/bin/bash 
ipvs_modules="ip_vs ip_vs_lc ip_vs_wlc ip_vs_rr ip_vs_wrr ip_vs_lblc ip_vs_lblcr 
ip_vs_dh ip_vs_sh ip_vs_fo ip_vs_nq ip_vs_sed ip_vs_ftp nf_conntrack" 
for kernel_module in ${ipvs_modules}; 
do 
    /sbin/modinfo -F filename ${kernel_module} > /dev/null 2>&1 
    if [ $? -eq 0 ]; then 
        /sbin/modprobe ${kernel_module} 
    fi 
done 
EOF

chmod 755 /etc/sysconfig/modules/ipvs.modules && bash /etc/sysconfig/modules/ipvs.modules && lsmod | grep ip_vs



# RockyLinux：
yum -y install ipvsadm ipset sysstat conntrack libseccomp
cat > /etc/modules-load.d/ipvs.conf <<EOF
ip_vs
ip_vs_lc
ip_vs_wlc
ip_vs_rr
ip_vs_wrr
ip_vs_lblc
ip_vs_lblcr
ip_vs_dh
ip_vs_sh
ip_vs_fo
ip_vs_nq
ip_vs_sed
ip_vs_ftp
nf_conntrack 
EOF



# ubuntu：
apt install -y ipvsadm ipset sysstat conntrack libseccomp2
cat >> /etc/modules <<EOF
# IPVS 相关模块
ip_vs
ip_vs_lc
ip_vs_wlc
ip_vs_rr
ip_vs_wrr
ip_vs_lblc
ip_vs_lblcr
ip_vs_dh
ip_vs_sh
ip_vs_fo
ip_vs_nq
ip_vs_sed
ip_vs_ftp
nf_conntrack
EOF

ShellScript

5. 安装 containerd （所有节点）

升级 libseccomp：

# centos7 默认的 libseccomp 的版本为 2.3.1 ，不满足 containerd 的需求，需要下载2.4以上的版本
# 如果不升级 libseccomp 的话，启动容器会报错
rpm -qa | grep libseccomp # 查询原来的版本
dpkg -l libseccomp2 # 在 ubuntu 系统中查询版本命令

rpm -e libseccomp-2.3.1-4.el7.x86_64 --nodeps #卸载原来的版本
wget https://mirrors.aliyun.com/centos/8/BaseOS/x86_64/os/Packages/libseccomp-2.5.1-1.el8.x86_64.rpm
rpm -ivh libseccomp-2.5.1-1.el8.x86_64.rpm

# centos7 默认的 libseccomp 的版本为 2.3.1 ，不满足 containerd 的需求，需要下载2.4以上的版本
# 如果不升级 libseccomp 的话，启动容器会报错
rpm -qa | grep libseccomp # 查询原来的版本
dpkg -l libseccomp2 # 在 ubuntu 系统中查询版本命令

rpm -e libseccomp-2.3.1-4.el7.x86_64 --nodeps #卸载原来的版本
wget https://mirrors.aliyun.com/centos/8/BaseOS/x86_64/os/Packages/libseccomp-2.5.1-1.el8.x86_64.rpm
rpm -ivh libseccomp-2.5.1-1.el8.x86_64.rpm

ShellScript

安装 containerd：

# 如果有，先卸载之前的旧版本 docker
yum remove docker docker-ce containerd docker-common docker-selinux docker-engine -y 

# 准备 repo
cd /etc/yum.repos.d/
wget http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
wget http://mirrors.aliyun.com/docker-ce/linux/rhel/docker-ce.repo
# 安装
yum install containerd* -y



# ubuntu:
apt install containerd* -y

# 如果有，先卸载之前的旧版本 docker
yum remove docker docker-ce containerd docker-common docker-selinux docker-engine -y 

# 准备 repo
cd /etc/yum.repos.d/
wget http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
wget http://mirrors.aliyun.com/docker-ce/linux/rhel/docker-ce.repo
# 安装
yum install containerd* -y



# ubuntu:
apt install containerd* -y

ShellScript

配置 containerd：

mkdir -pv /etc/containerd 
# 为 containerd 生成配置文件
containerd config default > /etc/containerd/config.toml  

# 替换默认 pause 镜像地址
# 这一步非常非常非常非常重要，国外的镜像地址可能导致下载失败，最终 kubeadm 安装失败
grep sandbox_image /etc/containerd/config.toml
# 替换镜像地址
sed -i 's/registry.k8s.io/registry.cn-hangzhou.aliyuncs.com\/google_containers/' /etc/containerd/config.toml 
grep sandbox_image /etc/containerd/config.toml

# 配置 systemd 作为容器的 cgroup driver
grep SystemdCgroup /etc/containerd/config.toml
sed -i 's/SystemdCgroup \= false/SystemdCgroup \= true/' /etc/containerd/config.toml
grep SystemdCgroup /etc/containerd/config.toml

# 配置加速器（必须配置，否则后续安装cni网络插件时无法从docker.io里下载镜像）
# 参考：
https://github.com/containerd/containerd/blob/main/docs/cri/config.md#registry
configuration
# 添加 config_path = "/etc/containerd/certs.d"
sed -i 's/config_path\ =.*/config_path = \"\/etc\/containerd\/certs.d\"/g' /etc/containerd/config.toml

# docker hub 镜像加速
mkdir -p /etc/containerd/certs.d/docker.io

cat > /etc/containerd/certs.d/docker.io/hosts.toml << 'EOF' 
server = "https://docker.io"
[host."https://docker.m.daocloud.io"]
capabilities = ["pull", "resolve"]

[host."https://docker.udayun.com"]
capabilities = ["pull", "resolve"]

[host."https://noohub.ru"]
capabilities = ["pull", "resolve"]

[host."https://huecker.io"]
capabilities = ["pull", "resolve"]

[host."https://dockerhub.timeweb.cloud"]
capabilities = ["pull", "resolve"]
EOF


# 配置 containerd 开机自启动
# 启动 containerd 服务并配置开机自启动
systemctl daemon-reload && systemctl restart containerd
systemctl enable --now containerd
# 查看 containerd 状态
systemctl status containerd
# 查看containerd的版本
ctr version

mkdir -pv /etc/containerd 
# 为 containerd 生成配置文件
containerd config default > /etc/containerd/config.toml  

# 替换默认 pause 镜像地址
# 这一步非常非常非常非常重要，国外的镜像地址可能导致下载失败，最终 kubeadm 安装失败
grep sandbox_image /etc/containerd/config.toml
# 替换镜像地址
sed -i 's/registry.k8s.io/registry.cn-hangzhou.aliyuncs.com\/google_containers/' /etc/containerd/config.toml 
grep sandbox_image /etc/containerd/config.toml

# 配置 systemd 作为容器的 cgroup driver
grep SystemdCgroup /etc/containerd/config.toml
sed -i 's/SystemdCgroup \= false/SystemdCgroup \= true/' /etc/containerd/config.toml
grep SystemdCgroup /etc/containerd/config.toml

# 配置加速器（必须配置，否则后续安装cni网络插件时无法从docker.io里下载镜像）
# 参考：
https://github.com/containerd/containerd/blob/main/docs/cri/config.md#registry
configuration
# 添加 config_path = "/etc/containerd/certs.d"
sed -i 's/config_path\ =.*/config_path = \"\/etc\/containerd\/certs.d\"/g' /etc/containerd/config.toml

# docker hub 镜像加速
mkdir -p /etc/containerd/certs.d/docker.io

cat > /etc/containerd/certs.d/docker.io/hosts.toml << 'EOF' 
server = "https://docker.io"
[host."https://docker.m.daocloud.io"]
capabilities = ["pull", "resolve"]

[host."https://docker.udayun.com"]
capabilities = ["pull", "resolve"]

[host."https://noohub.ru"]
capabilities = ["pull", "resolve"]

[host."https://huecker.io"]
capabilities = ["pull", "resolve"]

[host."https://dockerhub.timeweb.cloud"]
capabilities = ["pull", "resolve"]
EOF


# 配置 containerd 开机自启动
# 启动 containerd 服务并配置开机自启动
systemctl daemon-reload && systemctl restart containerd
systemctl enable --now containerd
# 查看 containerd 状态
systemctl status containerd
# 查看containerd的版本
ctr version

ShellScript

如果有代理服务器可以为 containerd 配置代理：

sudo mkdir -p /etc/systemd/system/containerd.service.d
sudo tee /etc/systemd/system/containerd.service.d/proxy.conf <<EOF
[Service]
Environment="HTTP_PROXY=http://hypervisor-01:20171"
Environment="HTTPS_PROXY=http://hypervisor-01:20171"
# 如需排除内网地址
Environment="NO_PROXY=localhost,127.0.0.1,.internal"
EOF

# 重新加载并重启
sudo systemctl daemon-reload
sudo systemctl restart containerd

sudo mkdir -p /etc/systemd/system/containerd.service.d
sudo tee /etc/systemd/system/containerd.service.d/proxy.conf <<EOF
[Service]
Environment="HTTP_PROXY=http://hypervisor-01:20171"
Environment="HTTPS_PROXY=http://hypervisor-01:20171"
# 如需排除内网地址
Environment="NO_PROXY=localhost,127.0.0.1,.internal"
EOF

# 重新加载并重启
sudo systemctl daemon-reload
sudo systemctl restart containerd

Bash

6. 部署负载均衡+keepalived

部署负载均衡+keepalived对外提供vip：192.168.2.150

6.1 三台 master 节点上部署配置 nginx

# 添加 repo 源
cat > /etc/yum.repos.d/nginx.repo << "EOF"
[nginx-stable]
name=nginx stable repo
baseurl=http://nginx.org/packages/centos/$releasever/$basearch/
gpgcheck=1
enabled=1
gpgkey=https://nginx.org/keys/nginx_signing.key
module_hotfixes=true

[nginx-mainline]
name=nginx mainline repo
baseurl=http://nginx.org/packages/mainline/centos/$releasever/$basearch/
gpgcheck=1
enabled=0
gpgkey=https://nginx.org/keys/nginx_signing.key
module_hotfixes=true
EOF

# 安装
yum install nginx -y
apt install nginx -y

# 配置
cat >> /etc/nginx/nginx.conf <<'EOF'

stream {
    upstream kube-servers {
        hash $remote_addr consistent;
        server k8s-master-01:6443 weight=5 max_fails=1 fail_timeout=3s;
        server k8s-master-02:6443 weight=5 max_fails=1 fail_timeout=3s;
        server k8s-master-03:6443 weight=5 max_fails=1 fail_timeout=3s;
    }
    server {
        listen 8443 reuseport;  # 监听8443端口
        proxy_connect_timeout 3s;
        proxy_timeout 3000s;
        proxy_pass kube-servers;
    }
}
EOF

# 启动
systemctl restart nginx 
systemctl enable nginx 
systemctl status nginx

# 添加 repo 源
cat > /etc/yum.repos.d/nginx.repo << "EOF"
[nginx-stable]
name=nginx stable repo
baseurl=http://nginx.org/packages/centos/$releasever/$basearch/
gpgcheck=1
enabled=1
gpgkey=https://nginx.org/keys/nginx_signing.key
module_hotfixes=true

[nginx-mainline]
name=nginx mainline repo
baseurl=http://nginx.org/packages/mainline/centos/$releasever/$basearch/
gpgcheck=1
enabled=0
gpgkey=https://nginx.org/keys/nginx_signing.key
module_hotfixes=true
EOF

# 安装
yum install nginx -y
apt install nginx -y

# 配置
cat >> /etc/nginx/nginx.conf <<'EOF'

stream {
    upstream kube-servers {
        hash $remote_addr consistent;
        server k8s-master-01:6443 weight=5 max_fails=1 fail_timeout=3s;
        server k8s-master-02:6443 weight=5 max_fails=1 fail_timeout=3s;
        server k8s-master-03:6443 weight=5 max_fails=1 fail_timeout=3s;
    }
    server {
        listen 8443 reuseport;  # 监听8443端口
        proxy_connect_timeout 3s;
        proxy_timeout 3000s;
        proxy_pass kube-servers;
    }
}
EOF

# 启动
systemctl restart nginx 
systemctl enable nginx 
systemctl status nginx

ShellScript

6.2 三台 master 节点上部署配置 keepalived

# 安装
yum  -y install  keepalived
apt  -y install  keepalived

# 修改配置
mv /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
# 各个 master节点修改 router_id 和 mcast_src_ip 的值即可
# ==================================> k8s-master-01
sudo useradd -r -s /usr/sbin/nologin -M -d /nonexistent keepalived_script
cat > /etc/keepalived/keepalived.conf <<EOF
! Configuration File for keepalived

global_defs {
    router_id 192.168.2.151
    script_user keepalived_script  # 执行脚本使用 keepalived_script 用户
    enable_script_security 
}

vrrp_script chk_nginx {
    script "/etc/keepalived/check_port.sh" 
    interval 2
    weight -20
}

vrrp_instance VI_1 {
    state BACKUP
    interface enp1s0     # 注意修改网卡
    virtual_router_id 100
    priority 100
    advert_int 1
    mcast_src_ip 192.168.2.151
    #nopreempt
    authentication {
        auth_type PASS
        auth_pass 1234
    }
    track_script {
        chk_nginx
    }
    virtual_ipaddress {
        192.168.2.150   # VIP 地址
    }
}
EOF

# ==================================> k8s-master-02
sudo useradd -r -s /usr/sbin/nologin -M -d /nonexistent keepalived_script
cat > /etc/keepalived/keepalived.conf <<EOF
! Configuration File for keepalived

global_defs {
    router_id 192.168.2.152
    script_user keepalived_script  # 执行脚本使用 keepalived_script 用户
    enable_script_security 
}

vrrp_script chk_nginx {
    script "/etc/keepalived/check_port.sh" 
    interval 2
    weight -20
}

vrrp_instance VI_1 {
    state BACKUP
    interface enp1s0
    virtual_router_id 100
    priority 90
    advert_int 1
    mcast_src_ip 192.168.2.152
    #nopreempt
    authentication {
        auth_type PASS
        auth_pass 1234
    }
    track_script {
        chk_nginx
    }
    virtual_ipaddress {
        192.168.2.150
    }
}
EOF

# ==================================> k8s-master-03
sudo useradd -r -s /usr/sbin/nologin -M -d /nonexistent keepalived_script
cat > /etc/keepalived/keepalived.conf <<EOF
! Configuration File for keepalived

global_defs {
    router_id 192.168.2.153
    script_user keepalived_script  # 执行脚本使用 keepalived_script 用户
    enable_script_security
}

vrrp_script chk_nginx {
    script "/etc/keepalived/check_port.sh" 
    interval 2
    weight -20
}

vrrp_instance VI_1 {
    state BACKUP
    interface enp1s0
    virtual_router_id 100
    priority 90
    advert_int 1
    mcast_src_ip 192.168.2.153
    #nopreempt
    authentication {
        auth_type PASS
        auth_pass 1234
    }
    track_script {
        chk_nginx
    }
    virtual_ipaddress {
        192.168.2.150
    }
}
EOF





# 所有 master 节点上创建健康检查脚本
cat > /etc/keepalived/check_port.sh << 'EOF'
#!/bin/bash

# 设置环境变量，确保所有必要的命令路径正确
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin

CHK_PORT=8443
PORT_PROCESS=$(ss -tulnp | grep ":$CHK_PORT" | wc -l)
if [ $PORT_PROCESS -eq 0 ];then
    echo "Nginx is NOT listening on port $CHK_PORT."
    exit 1
else
    echo "Nginx is listening on port $CHK_PORT."
    exit 0
fi
EOF


# 设置脚本权限
chown keepalived_script:keepalived_script /etc/keepalived/check_port.sh
chmod 750 /etc/keepalived/check_port.sh




# 启动
systemctl restart keepalived            
systemctl enable keepalived         
systemctl status keepalived


# 在一个 master 节点可以查看到 vip
ip addr show dev ens33
# 测试
# 停掉拥有 VIP 的节点的 Nginx，VIP 转移到其他节点

# 动态查看 keepalived 日志
 journalctl -u keepalived -f

# 安装
yum  -y install  keepalived
apt  -y install  keepalived

# 修改配置
mv /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
# 各个 master节点修改 router_id 和 mcast_src_ip 的值即可
# ==================================> k8s-master-01
sudo useradd -r -s /usr/sbin/nologin -M -d /nonexistent keepalived_script
cat > /etc/keepalived/keepalived.conf <<EOF
! Configuration File for keepalived

global_defs {
    router_id 192.168.2.151
    script_user keepalived_script  # 执行脚本使用 keepalived_script 用户
    enable_script_security 
}

vrrp_script chk_nginx {
    script "/etc/keepalived/check_port.sh" 
    interval 2
    weight -20
}

vrrp_instance VI_1 {
    state BACKUP
    interface enp1s0     # 注意修改网卡
    virtual_router_id 100
    priority 100
    advert_int 1
    mcast_src_ip 192.168.2.151
    #nopreempt
    authentication {
        auth_type PASS
        auth_pass 1234
    }
    track_script {
        chk_nginx
    }
    virtual_ipaddress {
        192.168.2.150   # VIP 地址
    }
}
EOF

# ==================================> k8s-master-02
sudo useradd -r -s /usr/sbin/nologin -M -d /nonexistent keepalived_script
cat > /etc/keepalived/keepalived.conf <<EOF
! Configuration File for keepalived

global_defs {
    router_id 192.168.2.152
    script_user keepalived_script  # 执行脚本使用 keepalived_script 用户
    enable_script_security 
}

vrrp_script chk_nginx {
    script "/etc/keepalived/check_port.sh" 
    interval 2
    weight -20
}

vrrp_instance VI_1 {
    state BACKUP
    interface enp1s0
    virtual_router_id 100
    priority 90
    advert_int 1
    mcast_src_ip 192.168.2.152
    #nopreempt
    authentication {
        auth_type PASS
        auth_pass 1234
    }
    track_script {
        chk_nginx
    }
    virtual_ipaddress {
        192.168.2.150
    }
}
EOF

# ==================================> k8s-master-03
sudo useradd -r -s /usr/sbin/nologin -M -d /nonexistent keepalived_script
cat > /etc/keepalived/keepalived.conf <<EOF
! Configuration File for keepalived

global_defs {
    router_id 192.168.2.153
    script_user keepalived_script  # 执行脚本使用 keepalived_script 用户
    enable_script_security
}

vrrp_script chk_nginx {
    script "/etc/keepalived/check_port.sh" 
    interval 2
    weight -20
}

vrrp_instance VI_1 {
    state BACKUP
    interface enp1s0
    virtual_router_id 100
    priority 90
    advert_int 1
    mcast_src_ip 192.168.2.153
    #nopreempt
    authentication {
        auth_type PASS
        auth_pass 1234
    }
    track_script {
        chk_nginx
    }
    virtual_ipaddress {
        192.168.2.150
    }
}
EOF





# 所有 master 节点上创建健康检查脚本
cat > /etc/keepalived/check_port.sh << 'EOF'
#!/bin/bash

# 设置环境变量，确保所有必要的命令路径正确
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin

CHK_PORT=8443
PORT_PROCESS=$(ss -tulnp | grep ":$CHK_PORT" | wc -l)
if [ $PORT_PROCESS -eq 0 ];then
    echo "Nginx is NOT listening on port $CHK_PORT."
    exit 1
else
    echo "Nginx is listening on port $CHK_PORT."
    exit 0
fi
EOF


# 设置脚本权限
chown keepalived_script:keepalived_script /etc/keepalived/check_port.sh
chmod 750 /etc/keepalived/check_port.sh




# 启动
systemctl restart keepalived            
systemctl enable keepalived         
systemctl status keepalived


# 在一个 master 节点可以查看到 vip
ip addr show dev ens33
# 测试
# 停掉拥有 VIP 的节点的 Nginx，VIP 转移到其他节点

# 动态查看 keepalived 日志
 journalctl -u keepalived -f

ShellScript

7. 部署 k8s 集群

7.1 安装 k8s 相关组件

# 阿里云文档参考：https://developer.aliyun.com/mirror/kubernetes/

# centos:
# 配置镜像源
cat > /etc/yum.repos.d/kubernetes.repo << "EOF" 
[kubernetes] 
name=Kubernetes 
baseurl=https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.31/rpm/ 
enabled=1 
gpgcheck=1 
gpgkey=https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.31/rpm/repodata/repomd.xml.key 
EOF

# 安装（所有节点）
yum install -y kubelet-1.31* kubeadm-1.31* kubectl-1.31*
systemctl enable kubelet && systemctl start kubelet && systemctl status kubelet


# ubuntu:
apt-get install -y apt-transport-https
curl -fsSL https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.30/deb/Release.key | gpg --dearmor -o /etc/apt/keyrings/kubernetes-apt-keyring.gpg

echo "deb [signed-by=/etc/apt/keyrings/kubernetes-apt-keyring.gpg] https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.30/deb/ /" | tee /etc/apt/sources.list.d/kubernetes.list
apt-get update
apt-get install -y kubelet kubeadm kubectl

# 阿里云文档参考：https://developer.aliyun.com/mirror/kubernetes/

# centos:
# 配置镜像源
cat > /etc/yum.repos.d/kubernetes.repo << "EOF" 
[kubernetes] 
name=Kubernetes 
baseurl=https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.31/rpm/ 
enabled=1 
gpgcheck=1 
gpgkey=https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.31/rpm/repodata/repomd.xml.key 
EOF

# 安装（所有节点）
yum install -y kubelet-1.31* kubeadm-1.31* kubectl-1.31*
systemctl enable kubelet && systemctl start kubelet && systemctl status kubelet


# ubuntu:
apt-get install -y apt-transport-https
curl -fsSL https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.30/deb/Release.key | gpg --dearmor -o /etc/apt/keyrings/kubernetes-apt-keyring.gpg

echo "deb [signed-by=/etc/apt/keyrings/kubernetes-apt-keyring.gpg] https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.30/deb/ /" | tee /etc/apt/sources.list.d/kubernetes.list
apt-get update
apt-get install -y kubelet kubeadm kubectl

ShellScript

7.2 初始化集群

# 初始化 master节点(仅在 k8s-master-01节点上执行)： 
# 列出当前 Kubernetes 版本所需的全部核心镜像
kubeadm config images list
registry.k8s.io/kube-apiserver:v1.31.10
registry.k8s.io/kube-controller-manager:v1.31.10
registry.k8s.io/kube-scheduler:v1.31.10
registry.k8s.io/kube-proxy:v1.31.10
registry.k8s.io/coredns/coredns:v1.11.3
registry.k8s.io/pause:3.10
registry.k8s.io/etcd:3.5.15-0
# 注意：registry.k8s.io/pause:3.10镜像版本可能与containerd配置文件中不同，修改每个节点containerd配置文件中的镜像版本
# containerd重新加载配置文件并重启


# 先生成配置文件，编辑修改后，再部署
kubeadm config print init-defaults > kubeadm.yaml

# 配置文件示例
apiVersion: kubeadm.k8s.io/v1beta3
bootstrapTokens:
- groups:
  - system:bootstrappers:kubeadm:default-node-token
  token: abcdef.0123456789abcdef
  ttl: 24h0m0s
  usages:
  - signing
  - authentication
kind: InitConfiguration
localAPIEndpoint:
  advertiseAddress: 0.0.0.0  # 统一监听在0.0.0.0即可
  bindPort: 6443
nodeRegistration:
  criSocket: unix:///var/run/containerd/containerd.sock
  imagePullPolicy: IfNotPresent
  name: k8s-master-01  # 当前的主机名
  taints: null
---
apiServer:
  timeoutForControlPlane: 4m0s
apiVersion: kubeadm.k8s.io/v1beta3
certificatesDir: /etc/kubernetes/pki
clusterName: kubernetes
controllerManager: {}
dns: {}
etcd:
  local:
    dataDir: /var/lib/etcd   # 内部 etcd 服务就直接指定本地文件夹就行
imageRepository: registry.cn-hangzhou.aliyuncs.com/google_containers  # 换成阿里云镜像仓库地址
kind: ClusterConfiguration
kubernetesVersion: 1.31.10  # 指定 k8s 版本
controlPlaneEndpoint: "api-server:8443"  # 指定你的vip地址192.168.2.150与负载均衡暴漏的端口，建议用主机名
networking:
  dnsDomain: cluster.local
  serviceSubnet: 10.96.0.0/12  # 指定 Service 网段
  podSubnet: 10.244.0.0/16  # 增加一行，指定pod网段
scheduler: {}
# 在文件最后,挿入以下内容,(复制时,要帯着--):
---
apiVersion: kubeproxy.config.k8s.io/v1alpha1
kind: KubeProxyConfiguration
mode: ipvs   # 表示kube-proxy代理模式是ipvs，如果不指定ipvs，会默认使用iptables，但是iptables效率低，所以我们生产环境建议开启ipvs，阿里云和华为云托管的K8s，也提供ipvs模式
---
apiVersion: kubelet.config.k8s.io/v1beta1
kind: KubeletConfiguration
cgroupDriver: systemd

# 部署
kubeadm init --config=kubeadm.yaml --ignore-preflight-errors=SystemVerification --ignore-preflight-errors=Swap

# 部署成功显示结果
Your Kubernetes control-plane has initialized successfully!

To start using your cluster, you need to run the following as a regular user:

  mkdir -p $HOME/.kube
  sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
  sudo chown $(id -u):$(id -g) $HOME/.kube/config

Alternatively, if you are the root user, you can run:

  export KUBECONFIG=/etc/kubernetes/admin.conf

You should now deploy a pod network to the cluster.
Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
  https://kubernetes.io/docs/concepts/cluster-administration/addons/

You can now join any number of control-plane nodes by copying certificate authorities
and service account keys on each node and then running the following as root:

  kubeadm join api-server:8443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:efb37c407e4eaef751d402eed838e44b2defeb4c45e03b6d2151e62ca915e0f7 --control-plane 

Then you can join any number of worker nodes by running the following on each as root:

kubeadm join api-server:8443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:efb37c407e4eaef751d402eed838e44b2defeb4c45e03b6d2151e62ca915e0f7
	
# 为管理用户添加凭证
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

# 初始化 master节点(仅在 k8s-master-01节点上执行)： 
# 列出当前 Kubernetes 版本所需的全部核心镜像
kubeadm config images list
registry.k8s.io/kube-apiserver:v1.31.10
registry.k8s.io/kube-controller-manager:v1.31.10
registry.k8s.io/kube-scheduler:v1.31.10
registry.k8s.io/kube-proxy:v1.31.10
registry.k8s.io/coredns/coredns:v1.11.3
registry.k8s.io/pause:3.10
registry.k8s.io/etcd:3.5.15-0
# 注意：registry.k8s.io/pause:3.10镜像版本可能与containerd配置文件中不同，修改每个节点containerd配置文件中的镜像版本
# containerd重新加载配置文件并重启


# 先生成配置文件，编辑修改后，再部署
kubeadm config print init-defaults > kubeadm.yaml

# 配置文件示例
apiVersion: kubeadm.k8s.io/v1beta3
bootstrapTokens:
- groups:
  - system:bootstrappers:kubeadm:default-node-token
  token: abcdef.0123456789abcdef
  ttl: 24h0m0s
  usages:
  - signing
  - authentication
kind: InitConfiguration
localAPIEndpoint:
  advertiseAddress: 0.0.0.0  # 统一监听在0.0.0.0即可
  bindPort: 6443
nodeRegistration:
  criSocket: unix:///var/run/containerd/containerd.sock
  imagePullPolicy: IfNotPresent
  name: k8s-master-01  # 当前的主机名
  taints: null
---
apiServer:
  timeoutForControlPlane: 4m0s
apiVersion: kubeadm.k8s.io/v1beta3
certificatesDir: /etc/kubernetes/pki
clusterName: kubernetes
controllerManager: {}
dns: {}
etcd:
  local:
    dataDir: /var/lib/etcd   # 内部 etcd 服务就直接指定本地文件夹就行
imageRepository: registry.cn-hangzhou.aliyuncs.com/google_containers  # 换成阿里云镜像仓库地址
kind: ClusterConfiguration
kubernetesVersion: 1.31.10  # 指定 k8s 版本
controlPlaneEndpoint: "api-server:8443"  # 指定你的vip地址192.168.2.150与负载均衡暴漏的端口，建议用主机名
networking:
  dnsDomain: cluster.local
  serviceSubnet: 10.96.0.0/12  # 指定 Service 网段
  podSubnet: 10.244.0.0/16  # 增加一行，指定pod网段
scheduler: {}
# 在文件最后,挿入以下内容,(复制时,要帯着--):
---
apiVersion: kubeproxy.config.k8s.io/v1alpha1
kind: KubeProxyConfiguration
mode: ipvs   # 表示kube-proxy代理模式是ipvs，如果不指定ipvs，会默认使用iptables，但是iptables效率低，所以我们生产环境建议开启ipvs，阿里云和华为云托管的K8s，也提供ipvs模式
---
apiVersion: kubelet.config.k8s.io/v1beta1
kind: KubeletConfiguration
cgroupDriver: systemd

# 部署
kubeadm init --config=kubeadm.yaml --ignore-preflight-errors=SystemVerification --ignore-preflight-errors=Swap

# 部署成功显示结果
Your Kubernetes control-plane has initialized successfully!

To start using your cluster, you need to run the following as a regular user:

  mkdir -p $HOME/.kube
  sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
  sudo chown $(id -u):$(id -g) $HOME/.kube/config

Alternatively, if you are the root user, you can run:

  export KUBECONFIG=/etc/kubernetes/admin.conf

You should now deploy a pod network to the cluster.
Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
  https://kubernetes.io/docs/concepts/cluster-administration/addons/

You can now join any number of control-plane nodes by copying certificate authorities
and service account keys on each node and then running the following as root:

  kubeadm join api-server:8443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:efb37c407e4eaef751d402eed838e44b2defeb4c45e03b6d2151e62ca915e0f7 --control-plane 

Then you can join any number of worker nodes by running the following on each as root:

kubeadm join api-server:8443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:efb37c407e4eaef751d402eed838e44b2defeb4c45e03b6d2151e62ca915e0f7
	
# 为管理用户添加凭证
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

ShellScript

7.3 多个 master 节点加入集群

上传证书：

将集群控制平面所需的证书上传到集群中，并存储在一个叫做 kubeadm-certs 的 Secret 中

# 仅在 k8s-master-01节点上执行
kubeadm init phase upload-certs --upload-certs # 你也可以在安装的时候 kubeadm init 的默认加上选项--upload-certs来上传证书，那这一步就不需要了

# 得到该值，后续添加master需要用到它
[upload-certs] Using certificate key:
c4d33271a56cd44e4df98f32e387fa74a77aaf8ce619782537ab5d822f48ee00

# 仅在 k8s-master-01节点上执行
kubeadm init phase upload-certs --upload-certs # 你也可以在安装的时候 kubeadm init 的默认加上选项--upload-certs来上传证书，那这一步就不需要了

# 得到该值，后续添加master需要用到它
[upload-certs] Using certificate key:
c4d33271a56cd44e4df98f32e387fa74a77aaf8ce619782537ab5d822f48ee00

ShellScript

上述步骤说明：

上传证书到集群：将已经生成的控制平面证书上传到 Kubernetes 集群，使得这些证书可以在多个Master 节点之间共享。
生成证书密钥：生成一个唯一的密钥用于加密和保护这些证书。
输出证书密钥：在终端输出这个证书密钥，后续添加新的 Master 节点时需要使用。

上述步骤目的：

方便其他 Master 节点在加入集群时能够共享这些证书。这个步骤极大简化了多 Master 节点的配置过程，确保所有 Master 节点使用相同的证书。
如果你没有这一步骤，那么每一个新加入的 Master 节点会自己生成一份新的证书，这样可能导致集群内的证书不一致，增加管理复杂度。使用 kubeadm init phase upload-certs –upload-certs 可以确保所有控制平面节点使用相同的证书，简化管理并且提高安全性和一致性。因此，尽管这一步不是绝对必要的，但强烈推荐使用它。

添加 master 节点到集群：

# 所有其他 master节点加入集群
kubeadm join api-server:8443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:efb37c407e4eaef751d402eed838e44b2defeb4c45e03b6d2151e62ca915e0f7 --control-plane --certificate-key c4d33271a56cd44e4df98f32e387fa74a77aaf8ce619782537ab5d822f48ee00   


# 成功后按照提示执行
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

# 所有其他 master节点加入集群
kubeadm join api-server:8443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:efb37c407e4eaef751d402eed838e44b2defeb4c45e03b6d2151e62ca915e0f7 --control-plane --certificate-key c4d33271a56cd44e4df98f32e387fa74a77aaf8ce619782537ab5d822f48ee00   


# 成功后按照提示执行
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

ShellScript

7.4 多个 worker 节点加入集群

# 加入工作节点
kubeadm join api-server:8443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:efb37c407e4eaef751d402eed838e44b2defeb4c45e03b6d2151e62ca915e0f7


# 在 master 节点查看所有节点
kubectl get nodes
# 查看静态 pod
kubectl -n kube-system get pods

# 加入工作节点
kubeadm join api-server:8443 --token abcdef.0123456789abcdef --discovery-token-ca-cert-hash sha256:efb37c407e4eaef751d402eed838e44b2defeb4c45e03b6d2151e62ca915e0f7


# 在 master 节点查看所有节点
kubectl get nodes
# 查看静态 pod
kubectl -n kube-system get pods

ShellScript

7.5 安装网络插件

# 下载网络插件
wget https://github.com/flannel-io/flannel/releases/latest/download/kube-flannel.yml

vim kube-flannel.yml 
apiVersion: v1
data:
  ...
  net-conf.json: |
    {
      "Network": "10.244.0.0/16", # 与--pod-network-cidr保持一致
      "Backend": {
        "Type": "vxlan"
      }
    }
    

# 在 k8s-master-01-C-201上部署
kubectl apply -f kube-flannel.yml 
kubectl -n kube-flannel get pods
kubectl -n kube-flannel get pods -w

# 下载网络插件
wget https://github.com/flannel-io/flannel/releases/latest/download/kube-flannel.yml

vim kube-flannel.yml 
apiVersion: v1
data:
  ...
  net-conf.json: |
    {
      "Network": "10.244.0.0/16", # 与--pod-network-cidr保持一致
      "Backend": {
        "Type": "vxlan"
      }
    }
    

# 在 k8s-master-01-C-201上部署
kubectl apply -f kube-flannel.yml 
kubectl -n kube-flannel get pods
kubectl -n kube-flannel get pods -w

ShellScript

8. 配置 kubectl 命令补全

# 安装 Bash 自动补全功能
sudo yum install bash-completion* -y
sudo apt install bash-completion* -y

# 生成 kubectl 命令的 Bash 自动补全配置，ubuntu 修改 $HOME/.bash_profile为$HOME/.bprofile
kubectl completion bash > ~/.kube/completion.bash.inc
echo "source '$HOME/.kube/completion.bash.inc'" >> $HOME/.bash_profile
# 立即生效
source $HOME/.bash_profile

# 安装 Bash 自动补全功能
sudo yum install bash-completion* -y
sudo apt install bash-completion* -y

# 生成 kubectl 命令的 Bash 自动补全配置，ubuntu 修改 $HOME/.bash_profile为$HOME/.bprofile
kubectl completion bash > ~/.kube/completion.bash.inc
echo "source '$HOME/.kube/completion.bash.inc'" >> $HOME/.bash_profile
# 立即生效
source $HOME/.bash_profile

ShellScript