近期线上的数据遇到一个问题,最终原因为max_user_connections和max_connections的一个bug导致,具体过程如下 现象 前端页面不断的出现错误页面. 排查处理过程 按照数据库的标准排查流程,首先看延迟,慢查询,连接数,这三个最容易出现问题的地方. 第一时间发现有较大的延迟超过800s,经过分析慢查询日志发现是一条DELETE SQL没有使用索引导致全表查询引发的对服务器IO性能消耗过多导致的. 同事前端的兄弟们也发现这个业务的调用量徒增几百倍,从一个没什么访问量的业务…