【笔记】两个根因分析方法:5WHY&10WHY
什么是问题根因分析
根本原因分析(root cause analysis):通过调查和分析问题哪里出错、为什么出错,寻求防止差错事故再次发生的必要措施,从而提高服务安全和质量。
根因分析目标
- 问题(发生了什么)
- 原因(为什么发生)
- 措施(什么方法能够阻止问题再次发生)
WHY-WHY分析法(5WHY,5W)
5W分析:是一个诊断性技术,用于识别和说明因果关系链,它的根源会恰当地定义问题。不断提问为什么前一个事件会发生,直到回答“没有好的理由”或者直到一个新的故障模式被发现才停止提问。解释根本原因以防止问题重演。具体步骤如下:
一、把握现状
步骤1:识别问题
- 我知道什么?(大、模糊或复杂问题 ——> 详细事实)
步骤2:澄清问题
- 实际发生什么?
- 应该发生什么?
步骤3:分解问题
- 还知道什么?
- 是否存在其他子问题?
步骤4:查找原因要点(PoC)
- 需要去哪里?
- 需要看什么?
- 谁可能掌握有关问题的信息?
步骤5:把握问题的倾向
- 谁?
- 哪个?
- 什么时间?
- 多次频次?
- 多大量?
二、原因调查
步骤6:识别并确认异常现象的直接原因
- 问题为什么发生时?
- 是否能看见问题直接原因?
- 如果不能,怀疑什么是潜在原因?
- 怎么核实最可能的潜在原因?
- 怎么确认直接原因?
步骤7:使用5WHY调查方法来建立一个通向根本原因的原因/效果关系链
- 处理直接原因能防止再发生吗?
- 如果不能,是否可以发现下一级原因?
- 如果不能,我怀疑什么是下一级原因?
- 怎么才能核实和确认下一级有原因呢?
- 处理这一级原因会防止再发生吗?
如果不行,继续问“为什么”直到找到根本原因。
在必须处理以防止再发生的原因处停止,问:
- 我已经找到问题的根本原因了吗?
- 我能通过处理这个原因来防止再发生吗?
- 这个原因能通过以事实为依据的原因/效果关系链与问题联系起来吗?
- 这个链通过了“因此”检验了吗?
- 如果我再问“为什么”会进入另一个问题吗?
还需要使用5WHY回来这些问题:
- 为什么我们有了这个问题?
- 为什么问题会到达顾客/用户处?(为什么没有发现问题?)
- 为什么我们的系统允许问题发生?
三、问题纠正
步骤8:采取明确的措施来处理问题
- 使用临时措施去处理异常现象直到根本原因能够被处理。
- 实施纠正措施来处理根本原因以防止再发生。
- 跟踪并核实结果:解决方案是否有效?如何确认?
四、通过“差错防止”过程进行预防
- 采取明确措施确保问题不会再发生,典型的措施是“差错防止”过程。
- 铭记吸取到的教训。
10why问题分析
- 1w:这个问题是什么?有什么影响?
- 2w:为什么会出现这个问题?什么场景会出现这个问题?
- 3w:这个问题在哪个阶段发现?——是否能更早?
- 4w:缺陷是在哪个阶段引入?
- 5w:为什么会在这个阶段引入问题?
- 6w:(how)如何避免引入这个问题?
- 7w:应该在哪个阶段发现问题?
- 8w:为什么没有在这个阶段发现问题?
- 9w:(how)如何才能在这个阶段发现问题?
- 10w:(how)如何基于风险测试过程,提前预估到这样的产品风险?
改进/优化措施思路
- 问题如何规避?
- 事情重来,过程哪些可以优化?
- 换一个人,是否能避免?
- 如果不能规避,哪个阶段最容易发现?如何保障这个阶段及时发现问题?
- 发布前——是否有工具/机制及时发现问题(如代码扫描)?发布性用例?
- 灰度——监控、反馈机制?
- 线上——监控、数据、反馈机制、反馈通道
- 问题处理过程是否可优化?
- 有效——解决过程决策是否正确?决策过程具体怎样?
- 效率——处理速度?哪里可以提效?
- 换位思考,如果是我会怎么做
- 结果负责:如何保障结果/产出
- 吸取教训:经验沉淀
参考:http://wiki.mbalib.com/wiki/WHY-WHY%E5%9B%BE
【笔记】两个根因分析方法:5WHY&10WHY的更多相关文章
- memcached学习笔记——存储命令源码分析上篇
原创文章,转载请标明,谢谢. 上一篇分析过memcached的连接模型,了解memcached是如何高效处理客户端连接,这一篇分析memcached源码中的process_update_command ...
- python笔记之常用模块用法分析
python笔记之常用模块用法分析 内置模块(不用import就可以直接使用) 常用内置函数 help(obj) 在线帮助, obj可是任何类型 callable(obj) 查看一个obj是不是可以像 ...
- Java内存溢出分析方法(Eclipse Memory Analyzer 使用简单入门)
转载至:http://outofmemory.cn/java/jvm/OutOfMemoryError-analysis 工具 安装Memory Analyse Tools(MAT) 工具, 可以直接 ...
- tensorflow笔记:多层LSTM代码分析
tensorflow笔记:多层LSTM代码分析 标签(空格分隔): tensorflow笔记 tensorflow笔记系列: (一) tensorflow笔记:流程,概念和简单代码注释 (二) ten ...
- 面向对象分析方法(I)
找出最关键的一些业务场景:一般通过动词来寻找,比如招聘系统中,一个应聘人投递一个职位就是一次应聘,应聘就是一个业务场景:一个学生参加某门课的考试,那么考试就是一个业务场景:一个学生去图书馆借书,那么借 ...
- Linux内核源码分析方法
一.内核源码之我见 Linux内核代码的庞大令不少人“望而生畏”,也正因为如此,使得人们对Linux的了解仅处于泛泛的层次.如果想透析Linux,深入操作系统的本质,阅读内核源码是最有效的途径.我们都 ...
- memcached学习笔记——存储命令源码分析下篇
上一篇回顾:<memcached学习笔记——存储命令源码分析上篇>通过分析memcached的存储命令源码的过程,了解了memcached如何解析文本命令和mencached的内存管理机制 ...
- 【JVM】Java中的JavaCore/HeapDump文件及其分析方法
产生时间 Java程序运行时,有时会产生JavaCore及HeapDump文件,它一般发生于Java程序遇到致命问题的情况下. 有时致命问题发生后,Java应用不会死掉,还能继续运行: 但有时致命问题 ...
- 《构建之法》教学笔记——Python中的效能分析与几个问题
<构建之法:现代软件工程>中第2章对效能分析进行了介绍,基于的工具是VSTS.由于我教授的学生中只有部分同学选修了C#,若采用书中例子讲解,学生可能理解起来比较困难.不过所有这些学生都学习 ...
随机推荐
- [Swift]LeetCode486. 预测赢家 | Predict the Winner
Given an array of scores that are non-negative integers. Player 1 picks one of the numbers from eith ...
- [Swift]LeetCode844. 比较含退格的字符串 | Backspace String Compare
Given two strings S and T, return if they are equal when both are typed into empty text editors. # m ...
- 14.Git分支-rebase有趣的例子、变基带来的问题及解决方案
1.有趣的变基例子 如下图所示,你创建了一个特性分支server,然后进行了一些提交(C3和C4),然后又从C3上创建了特性分支client,提交了C8和C9,最后你又回到了server,提交了C10 ...
- BBS论坛(二十)
20.1.cms添加轮播图后台逻辑代码完成 (1)apps/models.py from exts import db from datetime import datetime class Bann ...
- Dockerfile指令介绍
FROM:指定基础镜像 在Dockerfile中FROM是必备的指令,用于指定基础的镜像. FROM centos:latest LABEL:指定镜像标签 LABEL指令用来指定镜像的标签. 格式: ...
- Qt之自定义托盘(二)
上一篇文章讲述了自定义Qt托盘,不过不是使用QSystemTrayIcon这个类,而是我们自己完全自定义的一个类,我们只需要处理这个类的鼠标hover.鼠标左键点击.鼠标右键点击和鼠标左键双击,就可以 ...
- qt 拖拽 修改大小
写次篇文章之前,qt窗口的放大缩小和拖拽我都是通过setGeometry方法实现的,但是作为windows程序,windows支持橡 皮筋式(拖拽时有一个虚框)拖拽和拉伸.通过setGeometry方 ...
- 使用ML.NET和Azure Function进行机器学习 - 第1部分
介绍 一提到机器学习,总是让人望而生畏.幸运的是,Azure正在想方设法让开发人员更容易进入机器学习.ML.NET是Microsoft Research专为.NET开发人员开发的机器学习框架,因此您可 ...
- 从零打卡leetcode之day 4--无重复最长字符串
题目描述: 给定一个字符串,找出不含有重复字符的最长子串的长度. 示例: 给定 "abcabcbb" ,没有重复字符的最长子串是 "abc" ,那么长度就是3. ...
- linux中文件的三种time(atime,mtime,ctime)
linux下文件有3个时间的,分别是atime,mtime,ctime.有些博友对这3个时间还是比较迷茫和困惑的,我整理了下,写下来希望对博友们有所帮助. 1 这三个time的含义 简名 全名 中文名 ...