目前项目内部署了docker,于是涉及到关于监控的事情,参考一些经典实例以及一些自己的想法,总结一下思路. 1.关于监控的内容 监控宿主机本身 监控宿主机本身还是比较简单的,同其他服务器监控类似,对cpu.network.io.disk等做通用的检查,这里不再细说. 额外的,因为是docker的宿主机,还应该监控 容器本身的一些指标,如 : 拥有的全部的容器数量: 正在运行的容器的数量: dead容器的数量(如果此数量变化应该报警): docker 本身的信息,如Storage Driver.D