最近工作中的一个问题,耗时一个月之久终于调查完毕且顺利解决,顿时感慨万千.耗时之久和预期解决时间和环境搭建以及日志不合理等等有关,当然这个并非此文的重点.之所以在很久以后的今天又开始写文,主要是这个问题调查的过程值得铭记.具体情况如下文述. 一.问题发现过程数据告警服务提示相关分析结果缺失,经初步调查,发现分析服务在调用对应的NLP算法服务时出现大量Failed,遂查看算法日志,确实存在错误信息. 二.问题调查和解决1.定位问题 1) 反馈给算法相关开发同学:他们认为可能是该算法遇到了长文本数据…