概述 下面几个问题,相信广大 K8s 用户在日常集群运维中都曾经遇到过: 集群中的某个应用被删除了,谁干的? Apiserver 的负载突然变高,大量访问失败,集群中到底发生了什么? 集群节点 NotReady,是什么原因导致的? 集群的节点发生了自动扩容,是什么触发的?什么时间触发的? 以前,排查这些问题,对客户来说并不容易.生产环境中的 Kubernetes 集群通常是一个相当复杂的系统,底层是各种异构的主机.网络.存储等云基础设施,上层承载着大量的应用负载,中间运行着各种原生(例如:Sch…