在团队纷纷谈起工作效率的时候,对运维工作者,他们通常喜欢用「故障的平均解决时间」来衡量团队的工作效率.然而这往往是不正确的.一个迅速解决大量突发事故的团队十分高效,而实际上这更有可能意味着该团队的基础设施十分脆弱易损.那我们应该使用什么标准来衡量团队的工作效率呢? 本文系国内 ITOM 管理平台 OneAPM 翻译整理自Dan Turchin 2015 撰写的文章 <What is MTTR?Or why not to feed the baby cognac>, MTTR(平均恢复前时间)是…
实例恢复时间:指的是将数据文件的最后一个检查点(检查点位置)推进到控制文件中记录的最新SCN 所需的时间.管理员可以通过设置MTTR 目标以及调整重做日志组的大小来控制该时间.MTTR 指导:Mean Time To Repair,即平均修复时间.是指可修复产品的平均修复时间,就是从出现故障到修复中间的这段时间.MTTR 越短表示易恢复性越好.在数据库中可以通过设置参数FAST_START_MTTR_TARGET(单位为秒),控制数据库对单个实例执行崩溃恢复所花费的时间.FAST_START_M…
一般来说,对于设备的关键性指标的统计,国际惯例中有三个指标用来进行统计,它们分别是: MTTR(Mean Time To Repair),平均修复时间.计算方法是:总的故障时间/故障次数.计算公式为:MTTR =∑(T2+T3)/ N.MTTR越短表示易恢复性越好. MTTF(Mean Time To failures),平均故障时间.计算方法是:总的正常运行时间/故障次数.计算公式为:MTTF =∑T1/ N.该值越大,表示系统的可靠性越高,平均无故障时间越长. MTBF(Mean Time…
敏捷发展到今天已经在软件行业得到了广泛认可,但大多数敏捷方法都是为了解决某一特定问题而总结出来的特定方法或实践,一直缺乏一个可以将整个开发过程串接起来的成体系的方法.用户故事驱动的敏捷开发(User Story Driving Agile Development – UDAD)就是这样一套方法和实践,希望能够在软件开发的各个过程都提供最有效的方法让希望采用敏捷的团队能够有一个整体的方法论作为指导. 如何你对敏捷还缺乏了解,可以阅读以下文档: 关于敏捷开发 UDAD中采用了以下几个已经被广泛认可的…