最近开发的telemetry采集系统上线了.听起来高大上,简单来说就是一个grpc/udp服务端,用户的机器(路由器.交换机)将它们的各种统计数据上报采集.整理后交后端的各类AI分析系统分析.目前华为/思科的大部分设备支持. 上线之后,各类用户开始找来要求帮忙定位问题,一般是上报的数据在后端系统中不存在等等. 在一通抓包分析后,百分之99都是用户自己的问题.但频繁的抓包定位问题,严重的压缩了我摸鱼的时间.而且,这套系统采用多实例方式部署在腾X云多个容器中,一个个的登录抓包,真的很烦. 这让我萌生…