问题描述: 通过WebServer将监控数据入库到Hbase,在入库之前需要将指标与ip的列表更新到缓存中,以便前台页面随时选择查看.前两天上了一些新用户导致负载增加,逐渐发现某些用户的监控场景出现丢数据的情况,估计Tps要在1w以上.丢数据会导致前段曲线毛刺增加,体验极差,所以优化WebServer的接收程序需要立马执行. 解决过程: 查看GC,YGC频繁,但FGC基本很少发生,所以丢数据应该不是GC停顿导致的.既然是加了量导致,那么应该跟处理的性能有关.在看一遍代码,看出了问题.首先写入模块…