以前曾在Linux上维护应用服务,但是只是简单的迭代版本等工作,没有什么技术含量.最近部署在Linux服务器上的一个平台的总线进程broker(下面总线用broker指代)经常挂掉,由于总线负责服务之间通讯,分发消息给各个应用服务,总线一旦挂掉就导致整个平台瘫痪.总线进程挂掉需要人工重启,在没有找到具体原因前维护起来很不方便,而且往往是用户先发现才反馈过来,所以先写一个守护进程,一旦总线挂掉就重启.网上查了很多资料,总算搞出来了,大体写一下实现步骤,即是备忘也分享给大家,相互交流. 先说一下大体…