一般情况下,系统多多少少都会遇到点问题,那么遇到问题之后我们怎么定位原因呢?在这里我只说如何定位DB的问题. 看这篇文章有个前提:监控数据要完整!监控数据要完整!!监控数据要完整!!!比如下面这个乍一看,有个性能抖动,如何知道系统是不是有问题,可以通过以下途径知悉: 应用日志 监控报警 用户感知 无论是监控报警,还是用户感知,归根结底还得回归应用,从应用日志发现到底是哪个接口异常,接口异常的原因无外乎以下几种情况: 系统异常,比如超出负载 网络问题,比如网卡爆满,网络丢包 io问题,比如刷磁盘,…