KubeletPodStartUpLatencyHigh #
含义 #
节点上的 Pods 启动延迟比较高。启动延迟时间的 99% 分位数值超过 60s,且持续时间超过15分钟时,将触发这个告警。
影响 #
Pod 启动较慢。
诊断 #
消息详情/标签中包含 Node 信息。
- 检查节点状态是否就绪:
kubectl describe node $NODE_NAME
。 - 检查节点的 CPU 和内存资源是否存在过载。
- 检查节点网络和存储的性能,确保没有瓶颈影响到 Pod 的启动和状态更新。比如镜像的拉取延迟等。
- 检查节点上 Kubelet 的日志寻找可能的错误或警告信息:
journalctl -b -f -u kubelet.service
。
缓解 #
- 优化 Pod 数量。考虑将节点上的 Pods 分散到更多节点上,以降低节点负载。
- 优化镜像大小,以及镜像缓存策略。
- 优化网络性能。比如节点与镜像仓库之间的网络性能。