问题描述 A服务,是一个检测MGR集群主节点是否发生变化的服务,使用python语言实现的. 针对每个集群,主线程会创建一个子线程,并由子线程去检测.子线程会频繁的创建和销毁. 上线以后,由于经常会有功能发布,从而重启服务,开始一段时间没有发现问题. 半个月前的周二服务发布后,大约一周时间,没有再发布.到周末的时候,突然告警系统负载高,经过排查,发现内存几乎耗尽,并查到是A服务占用巨大内存,没有释放. 排查过程 已经确定,A服务是存在内存泄露的,到底是什么地方内存使用完,却没有释放呢? 这是一个…