昨天,正忙着,一个用户来电,说一个系统非常缓慢,导致整个系统无法正常使用,必须马上处理,先看系统资源,通过用户反馈的信息,内存,IO没问题,CPU资源严重紧张,idle持续为零,堆积任务达几百个,系统几近挂掉,通过分析用户反馈的数据库信息,最终确定一条SQL为整个事件的罪魁祸首,该语句阻塞达上百个,告知用户后,用户分析后确定,先kill掉相应会话,然后组织人员修改该SQL,kill掉相应会话并调整该SQL后,系统恢复常态,idle在40~50%间徘徊,下面是该SQL修改前的计划,大家可参考学习:…