通过命令模拟pod创建
介绍这篇文章主要涉及到 kubelet 通过 csi 向运行时发送创建请求,运行时发生了什么?pod 网络又是怎么连通的?
对应的流量图
https://cdn.nlark.com/yuque/0/2025/jpeg/42497920/1755755365084-430a9726-720d-4bb5-8202-ac2a11b181da.jpeg
我们将使用 docker 和 linux Bridge 去完成这个 pod 需求
流程描述
kubelet 通过 CRI 接口调用运行时(如 containerd)创建 pod。该过程分为两步:
[*]创建 Pod Sandbox:运行时先启动一个轻量的 pause 容器。其核心作用是调用 runc 创建并持有一个独立的 Linux Network Namespace,为 Pod 提供网络沙盒环境。
[*]创建业务容器:运行时随后创建业务容器(如 Nginx),并通过指定 network namespace 路径,使其直接加入 pause 容器所在的 Network Namespace,从而实现网络共享。
Pod 沙盒就绪后,运行时调用 CNI 插件配置网络。插件执行如下操作:
[*]创建 veth pair,一端放入容器命名空间内(命名为 eth0),另一端连接至主机网桥(如 br0)
[*]为容器内的 eth0 分配 IP 并设置路由,网关指向网桥。
[*]配置主机 iptables 规则,实现 SNAT 以使 Pod 能访问外部网络,并设置转发规则。
实际操作
创建网桥
这个网桥充当虚拟交换机,所有 pod 流量都通过该设备传递到物理网卡
# 增加一个网卡设备
ip link add name br0 type bridge
# 向网卡设备添加地址
ip addr add 10.0.0.1/24 dev br0
# 设置网卡启动
ip link set dev br0 up
# 验证
ip a启动 pod 外壳并劫持网络空间
# 创建pod外壳容器
docker run -itd --name my-pod --network=none docker.1ms.run/rancher/mirrored-pause:3.9
# 劫持容器网络命名空间
mkdir -p /var/run/netns
ln -sf /var/run/docker/netns/ce39ddc16db1 /var/run/netns/my-pod
# 验证
ip netnshttps://cdn.nlark.com/yuque/0/2025/png/42497920/1755852007790-a7e8ce29-35aa-4904-bba5-f17d8bca50ad.png
配置 pod 网络(模拟 CNI 插件)
我们将手动模拟 CNI(bridge)插件的工作:创建 veth pair,连接容器和网桥,分配 IP,设置路由
# 创建一对虚拟以太网设备(veth pair)
# veth-pod:将留在主机默认命名空间的一端
# veth-cont:将留在容器命名空间的一端
ip link add veth-pod type veth peer name veth-cont
# 将veth-cont 放到容器命名空间内部
ip link set veth-cont netns my-pod
# 重命名veth-cont,将其改成符合容器的标准名称eth0
ip netns exec my-pod ip link set veth-cont name eth0
# 启动容器内命名空间网卡
ip netns exec my-pod ip link set eth0 up
# 为容器命名空间内的网卡配置地址要和刚才网关网卡地址一致
ip netns exec my-pod ip addr add 10.0.0.2/24 dev eth0
# 添加到网关的路由
ip netns exec my-pod ip route add default via 10.0.0.1
# 给外面这一端网卡绑定master
ip link set veth-pod master br0
# 启动外面这一端网卡
ip link set veth-pod up
# 验证容器网络命名空间内网络环境
ip netns exec my-pod ip addr show
ip netns exec my-pod route -n
ip netns exec my-pod ping 10.0.0.1https://cdn.nlark.com/yuque/0/2025/png/42497920/1755853235016-c9ebe623-2694-4f70-a903-1eec46118cad.png
创建业务容器
docker run -itd --name nginx-pod --network container:my-pod nginx:alpine配置主机网络和 iptables 模拟 kubeporxy
为了让流量能进出 Pod,我们需要配置内核转发和 iptables 规则。
# 开启内核转发功能
echo 1 | sudo tee /proc/sys/net/ipv4/ip_forward
# 配置SNAT
# 解析:
#10.244.1.0/24(Pod网段),且要从主机的物理网卡(假设是eth0)出去的流量,将其源IP伪装成主机自己的IP。
# 这样,外部网络回包时才知道送回给哪个主机
iptables -t nat -A POSTROUTING -s 10.0.0.0/24 -o eth0 -j MASQUERADE
# 添加一条 iptables DNAT 规则,将端口转发到业务网络命名空间内
# -t nat: 操作 nat 表
# -A PREROUTING: 在数据包刚到达时就进行规则判断
# -p tcp --dport 30080: 匹配协议为 TCP,且目标端口是 30080 的流量
# -j DNAT: 进行目标地址转换(DNAT)
# --to-destination 10.0.0.2:80: 将目标地址改为 Pod 的 IP 和端口
iptables -t nat -D PREROUTING -p tcp --dport 30080 -j DNAT --to-destination 10.0.0.2:80
iptables -t nat -D OUTPUT -d 127.0.0.1/32 -p tcp --dport 30080 -j DNAT --to-destination 10.0.0.2:80
iptables -t nat -I PREROUTING 1 -p tcp --dport 30080 -j DNAT --to-destination 10.0.0.2:80
iptables -t nat -I OUTPUT 1 -p tcp --dport 30080 -j DNAT --to-destination 10.0.0.2:80
# 验证规则
iptables -t nat -L POSTROUTING -n -v
# 验证访问
curl -v http://192.168.1.114:30080https://cdn.nlark.com/yuque/0/2025/png/42497920/1756017529380-cbb5ddfc-74dc-4d98-b923-459ec88ad1f2.png
https://cdn.nlark.com/yuque/0/2025/png/42497920/1756020915030-f3b3057e-2433-49be-a555-a67c3520f11b.png
清理环境
# 删除容器
docker stop 4728aeef69f8
docker stop 3041747824eb
docker rm 3041747824eb
docker rm 4728aeef69f8重启主机
重启后所有规则默认删除
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! 鼓励转贴优秀软件安全工具和文档! yyds。多谢分享 收藏一下 不知道什么时候能用到 这个有用。 新版吗?好像是停更了吧。 不错,里面软件多更新就更好了 很好很强大我过来先占个楼 待编辑 感谢分享,学习下。 前排留名,哈哈哈 分享、互助 让互联网精神温暖你我 谢谢分享,试用一下 yyds。多谢分享 感谢分享,下载保存了,貌似很强大 用心讨论,共获提升! 东西不错很实用谢谢分享 感谢分享,学习下。 鼓励转贴优秀软件安全工具和文档! 懂技术并乐意极积无私分享的人越来越少。珍惜 懂技术并乐意极积无私分享的人越来越少。珍惜
页:
[1]
2