背景 公司云平台的机器时常会发生网络闪断,通常在10s-100s之间. 异常情况 VM出现问题时,表现出来的情况是外部监控系统无法访问,猜测可能是由于系统假死,OVS链路问题等等.但是在出现网络问题的时候,HV统一的表现为iowait较高. 排除过程 这是一个艰难的过程,由于无法重现现场,导致只能通过一些理论手段来推测原因. 确定是否是网络原因 闪断是否由OVS造成? 在对OVS做了一段时间的压力测试后,发现并未出现网络闪断的现象,这里的压测单纯只针对OVS,压测一段时间后并未发现有异常,初步排