Security Context 的目的是限制不可信容器的行为,保护系统和其他容器不受其影响。
Kubernetes 提供了三种配置 Security Context 的方法:
Container-level Security Context:仅应用到指定的容器
Pod-level Security Context:应用到 Pod 内所有容器以及 Volume
Pod Security Policies(PSP):应用到集群内部所有 Pod 以及 Volume
Container-level Security Context
Container-level Security Contextarrow-up-right 仅应用到指定的容器上,并且不会影响 Volume。比如设置容器运行在特权模式:
复制 apiVersion : v1
kind : Pod
metadata :
name : hello-world
spec :
containers :
- name : hello-world-container
# The container definition
# ...
securityContext :
privileged : true Pod-level Security Context
Pod-level Security Contextarrow-up-right 应用到 Pod 内所有容器,并且还会影响 Volume(包括 fsGroup 和 selinuxOptions)。
Supplemental Groups Policy(补充组策略)
Kubernetes v1.31 引入了 supplementalGroupsPolicy 字段作为 alpha 特性,并在 v1.33 中升级为 beta 版本(默认启用)。该特性提供了对容器补充组更精细的控制,特别是在访问卷时能够加强安全态势。
背景:容器镜像中的隐式组成员身份
默认情况下,Kubernetes 会将 Pod 中指定的组信息与容器镜像中 /etc/group 文件定义的组信息进行合并 。这种隐式合并可能带来安全风险,因为:
策略引擎无法检测或验证这些隐式 GID(它们不在 Pod 清单中)
supplementalGroupsPolicy 字段
该字段允许控制 Kubernetes 如何计算 Pod 内容器进程的补充组。可用的策略包括:
Merge (默认):容器主用户在 /etc/group 中定义的组成员身份将被合并。这是向后兼容的默认行为。
Strict :仅将 fsGroup、supplementalGroups 或 runAsGroup 中指定的组 ID 作为补充组附加到容器进程。忽略容器主用户在 /etc/group 中定义的组成员身份。
示例:使用 Strict 策略
使用 Strict 策略时,容器中 id 命令的输出将只包含明确指定的组:
supplementalGroupsPolicy: Strict 需要支持此功能的 CRI 运行时:
可以通过节点的 .status.features.supplementalGroupsPolicy 字段查看是否支持:
在 alpha 版本中,当具有 supplementalGroupsPolicy: Strict 的 Pod 被调度到不支持该功能的节点时,策略会静默回退到 Merge。
在 v1.33 beta 版本中,kubelet 会拒绝 其节点无法确保指定策略的 Pod。被拒绝时会看到警告事件:
该特性还通过 .status.containerStatuses[].user.linux 字段暴露附加到容器第一个进程的进程身份:
User Namespaces(用户命名空间)
User Namespaces(用户命名空间)是 Kubernetes v1.33 中默认启用的重要安全特性。它通过隔离容器内的用户和组 ID 与主机系统的用户和组 ID,提供了额外的安全隔离层。
从 Kubernetes v1.33 开始,用户命名空间功能默认启用,Pod 可以通过设置 hostUsers: false 来选择性使用:
用户命名空间提供以下重要安全改进:
权限隔离 :容器内的 root 用户(UID 0)被映射到主机上的非特权用户,大大降低容器逃逸的风险
横向移动防护 :即使攻击者获得了容器内的 root 权限,也无法访问主机系统或其他容器
文件系统隔离 :通过 idmap 挂载提供文件系统级别的用户 ID 隔离
使用用户命名空间需要满足以下条件:
内核版本 :推荐 Linux 5.19+,最佳体验需要 6.3+
容器运行时 :containerd 2.0+ 或 CRI-O
虽然大多数应用程序无需修改即可使用用户命名空间,但需要注意以下限制:
Pod Security Policies(PSP)
Pod Security Policies(PSP)是集群级的 Pod 安全策略,自动为集群内的 Pod 和 Volume 设置 Security Context。
使用 PSP 需要 API Server 开启 extensions/v1beta1/podsecuritypolicy,并且配置 PodSecurityPolicy admission 控制器。
由于 中从代码库中删除。PodSecurityPolicy API 不够灵活、认证模型不够完善且配置更新繁琐等缺陷,PodSecurityPolicy 已在 v1.21 正式弃用arrow-up-right ,并将在 v1.25 中从代码库中删除。已经使用 PodSecurityPolicy 的用户推荐迁移到 Open Policy Agentarrow-up-right 。
Kubernetes 版本
Extension 版本
使用 host user namespace(设为 false 启用用户命名空间隔离)
defaultAllowPrivilegeEscalation
限制容器的 host 端口范围为 8000-8080:
限制只允许使用 lvm 和 cifs 等 flexVolume 插件:
SELinux (Security-Enhanced Linux) 是一种强制访问控制(mandatory access control)的实现。它的作法是以最小权限原则(principle of least privilege)为基础,在 Linux 核心中使用 Linux 安全模块(Linux Security Modules)。SELinux 主要由美国国家安全局开发,并于 2000 年 12 月 22 日发行给开放源代码的开发社区。
可以通过 runcon 来为进程设置安全策略,ls 和 ps 的 - Z 参数可以查看文件或进程的安全策略。
修改 / etc/selinux/config 文件方法:
通过命令临时修改:
查询 SELinux 状态:
这会自动给 docker 容器生成如下的 HostConfig.Binds:
对应的 volume 也都会正确设置 SELinux: