如何设计你的应用,能够在系统错误时做到自我修复?在分布式系统中,会经常遇到错误.硬件也会遇到异常情况.网络有时会出现短暂的错误.整个地区出现了服务中断.即便如此,关于这些问题的方案也是要提前规划的.因此,需要设计一个能够在错误出现时完成自我修复的系统,主要包括以下3个部分:发现错误.正确的对待错误.使用日志并监控错误,提高可操控性.对故障类型的响应取决于应用的可用性的需求.例如,如果你需要系统是高可用的,你可能会希望在故障发生时,系统自动切换到辅助区域.然而,这种部署比单一区域的价格高的多.而且…