近期项目的看门狗经历了三个版本号. 第一个版本号: 用ps -ef,假设程序挂了就启动 第二个版本号: 程序因为执行时会出现不再监听7901port,所以不能简单推断机器是不是挂了,而是推断此port是否有监听 第三个版本号: 当7901port不再监听,就先把原来的killall再启动.每次输出到文件的内容都加日期,要不然根本不知道这事情啥时候发生的 第四个版本号: 使用nohup让程序和监控程序的echo输出到非标准设备而是文件.这样彻底脱离shell,从而退出一个shell的时候真正实现后…