KubeDaemonSetRolloutStuck #
含义 #
DaemonSet 更新卡住,正在等待 Pods 替换。
影响 #
服务性能下降甚至不可用。
诊断 #
消息详情/标签中包含 DaemonSet 的名称和 Namespace 信息。
- 检查 DaemonSet 的状态:
kubectl -n $NAMESPACE describe daemonset $NAME
。 - 检查 DaemonSet 的更新策略。
- 检查 Pod 模板参数配置:
- priority 优先级配置。可能一些重要性更高的 Pods 占用了资源,导致它无法调度。
- resources 资源配置。比如它尝试使用不可用的 GPU 资源,但这些资源限制在特定的 GPU 节点上。
- 亲和性规则。可能由于亲和性以及节点不足,导致它无法调度。
- 终止宽限期。Pod 终止花费时间较长。
缓解 #
查阅调试 Pods。