某些用户,机器重启后,到第三方服务器的连接起不来,而到我们自己服务器的连接就没事. 如果连接由于网络或其他原因fail掉,过一定时间后应该会重新尝试建立连接的. 测试组做初步调查,他们能在本地环境复现,只是不是稳定复现,时而有时而没有.(嗯,race condition的问题就常常比较飘忽不定,并且往往在系统繁忙负载高的时候爆发).我开始参与. 分析了一下现有的log,不能得出任何结论.所以在代码中另外增加了一些debug log,然后测试组再跑... 最后终于看到问题根本. 我们有两种类型的链…