分布式环境下,对于线上出现问题往往比单体应用要复杂的多,原因是前端的一个请求可能对应后端多个系统的多个请求,错综复杂. 对于快速问题定位,我们一般希望是这样的: 从下到下关键节点的日志,入参,出差,异常等. 关键节点的响应时间 关键节点依赖关系 而这些需求原来在单体应用中可以比较容易实现,但到了分布式环境,可能会出现: 每个系统的技术栈不同 有的系统有日志有的连日志都没有 日志实现手段不相同 以上系统都是自治的,要想看整体的调用链非常困难. 分布式系统日志统一的手段有很多,比如常见的ELK,但这