背景 今年3月份时候,线上发生一次大事故.公司主要后端服务器发生宕机,所有接口超时.宕机半小时后,又自动恢复正常.但是过了2小时,又再次发生宕机. 通过接口日志,发现MySQL数据库无法响应服务器.在阿里云的技术支持的帮助下,发现了MySQL数据库中存在大量慢查询,导致CPU负载过高.最后,根据慢查询日志,定位到了出问题的SQL和业务接口. 业务接口是一个分页接口,莫名被刷到7000多页,偏移量(offset)高达20w多.每当这条SQL执行时,数据库CPU直接打满.查询时间超过1分钟才有响应.