Kube DaemonSet Rollout Stuck

KubeDaemonSetRolloutStuck #

含义 #

DaemonSet 更新卡住,正在等待 Pods 替换。

影响 #

服务性能下降甚至不可用。

诊断 #

消息详情/标签中包含 DaemonSet 的名称和 Namespace 信息。

  • 检查 DaemonSet 的状态:kubectl -n $NAMESPACE describe daemonset $NAME
  • 检查 DaemonSet 的更新策略
  • 检查 Pod 模板参数配置:
    • priority 优先级配置。可能一些重要性更高的 Pods 占用了资源,导致它无法调度。
    • resources 资源配置。比如它尝试使用不可用的 GPU 资源,但这些资源限制在特定的 GPU 节点上。
    • 亲和性规则。可能由于亲和性以及节点不足,导致它无法调度。
    • 终止宽限期。Pod 终止花费时间较长。

缓解 #

查阅DaemonSet 滚动更新卡住

查阅调试 Pods