我特别反感那些不顾公司现状一上来就想要做研发效能度量的人,尤其是想把研发效能度量当成锤子四处去敲打螺丝钉的人。

没几个人的小公司上来就做研发效能度量,就如同普通人一上来直接问媒婆怎么能娶到迪丽热巴。解决办法无非把大象装冰箱里的那三步。套用一下,公司想要做好研发效能度量也有标准的三步:长时间对研发效能业务投入,建设好研发效能工具链,做好效能度量。现实是我们很多公司卡在了第一步上。我们可以边做研发效能平台边做效能度量,但不能啥也没有靠嘴造出来的效能度量,否则容易上下互相糊弄。

  • 长时间对研发效能业务投入
  • 完善研发效能工具链建设
  • 做好研发效能度量

和一些老板交流,经常被问到公司现在想做研发效能度量,要做什么指标,怎么做,多长时间能完成。做啥研发效能度量啊,先保证公司三年不倒再说。产研运同学在脉脉上喷公司的基建都喷出火星子了,还做啥研发效能度量。我建议不把这些小伙伴火上眉毛的事情解决,就不要做研发效能度量。

很多人想要些数据的心情是可以理解的,毕竟整天拍脑袋做决定太假大空了,自己心里都发毛。如果能有一些产研运的数据,然后再拍脑袋也会容易些,所以一上来就想做研发效能度量。但是有时候,我们低估了做这件事的难度,高估了做这件事的效果。

举个例子:

曾经有家公司的CTO想做研发效能度量,找PMO来驱动做这件事情。但是经过摸底发现现状如下:

  • 1)所有任务在 jira 中
  • 2)代码在 gitlab 中
  • 3)编译,构建,上线在发布系统中。只能按分支发布,不支持按 commit 发布,发布时可选择 jira 任务(非必需)
  • 4)PMO的小伙伴不知道从哪里收集的,罗列了各种度量指标,一个个问,这个指标是否可以出,怎么出,啥时候能得到。

此时很多数据不具有真实性,系统间无法打通,需要人为校对、处理,指标不能自动获取。其实如果我们站得角度高一些,应该坦诚地跟 CTO 去聊,我们现在这种情况根本不适合做效能度量,即便给出一份报表也是不真实的,无法反应实际产研运情况,如果再根据这个报表去做决策实际误差也许还不如拍脑袋。结果「拿着尚方宝剑」的PMO要求限时、保质保量地要这么一份报表,且以后定时出。结果可想而知,从多个数据库中去比对时间「攒」出的一份报告,简直不忍直视。还浪费了很多人力物力。

乔梁老师的《工程效率胜任力改善牵引指标体系》这篇文章(文末有链接)已经对研发效能度量的事情进行了很好的阐述,其中列出了19 个结果展示性指标,12 个维度的 50 个过程引导性指标,且在这篇文章的最后十分贴心地给出了「友情提示」:

  • 度量有成本,而且不低
  • 当指标变成目标后,它就不再是好的指标
  • 指标最终都会被玩弄
  • 改进不应「唯数字论」

- 明确研发效能度量的目标 -

要想做好研发效能首先要明确做的目的是什么,是给管理层看统计数据,还是让中基层了解业务运行情况做决策。

  • 很多数据一「平均」就掩盖掉了「大多数」问题,且变得毫无意义
  • 不同团队,甚至同一团队的不同时期的效能都有所差异,通过简单几个数字未必能有效度量
  • 出一些度量报告很容易,难的是通过度量报告进行根因分析,看到背后的问题;
  • 即便数字相同,背后的实际情况也是千差万别
  • 最好的「研发效能度量报告」是团队负责人:他们知道团队的效能,知道团队的问题在哪里,团队哪里效能低,怎么才能改进
  • 之所以「忍受」一些低效能低表现,是因为有「更高优的」工作或者有一些「难以诉说」的苦衷,这要靠脚踏实地深入一线去发掘。
  • 其次是每天工作在一线的同学,如果他们都不知道效能低的原因,却想通过一些度量指标反馈出来,这是有悖常理的。

怎么去解释好数字背后的情景也需要很大的投入。我们来举个例子

生产环境上线成功率:每个计算周期服务进行上线成功的次数/上线的总次数。

这个指标可以体现出服务上线的质量。这个指标是否管用呢?是的,管用。但是如果一味的追求指标的数值就会造成大家都不敢上线了,以前每天晚饭时间上线一次改成了只周四上一次线。对于一个功能正处在快速迭代的产品,我们更期待所有的功能能尽快推到用户的面前,收集用户的反馈,以便及时修改和增强。那么过度追求这个指标对业务的发展就是有害的。

如果再加上一个上线次数的指标要求呢?也就说既要求上线次数多又要求上线成功率高。这个时候在没有更好的方法保障质量和效率的情况下,就会对团队造成很大压力,团队一般会要求增加人员投入,比如更多的开发和测试同学。

如果研发和测试同学「必须」不能加,上线次数「必须」保证,上线成功率也「必须」保证,怎么办?典型的既要又要还要的情形。这个时候团队动作就会变得畸形了。产研运团队会要求排入迭代的需求个数降低,同时会出现一些没必要的上线动作。一些可改可不改的需求排了进去,一些大的需求会拆分成一些改动特别小的需求单独上线。。。这样看似上线次数没变,每天都有东西上线,上线成功率提高了,且人数也没加,但是多了很多意义不大的上线操作且最后上线的有价值的功能还少了。有变更就会有风险,有风险就可能会对用户造成问题。一旦造成问题,业务负责人就得负责。典型的金玉其外败絮其中。

- 本文小结 -

在还没有长时间投入研发效能团队的时候,在研发效能工具链还没成型的时候,不要贸然做研发效能度量。研发效能度量也是需要成本的,而且是很高的成本。与其前期投入一个产出不高的工作,不如加强研发工具的建设,去支持产研运工作的研发,把研发效能团队的价值在业务的增长和支持保障中体现出来。

参考:

工程效率胜任力改善牵引指标体系

infra | devops工具链基建建设评价标准

DevOps | 研发效能价值如何衡量

DevOps|研发效能不是老板工程,是开发者服务

devops|中小公司不要做研发效能度量的更多相关文章

  1. 互联网公司员工职级、研发效能度量、OKR与绩效考核

    今天要写这篇文章,来自最近有两个点触动了我.第一个触动点是奈飞(netflix)做出了一个巨大动作<"不搞职级.人人平等" 25 年后行不通了?Netflix 破天荒引入细分 ...

  2. DevOps|从特拉斯辞职风波到研发效能中的不靠谱人干的荒唐事

    今天发生了一件大事特拉斯辞任英国首相,我想借着这件事情说下我看到的一件研发效能的荒唐事,这其中的关联也许就是「都用了不靠谱的人」. 两件事情 今儿一早就听到,2022年10月20日英国第78任首相伊丽 ...

  3. 互联网研发效能之去哪儿网(Qunar)核心领域DevOps落地实践

    本文从业务目标角度出发,确定了开源+自建模式搭建 Qunar 研发工具链整体生态:通过 APPCODE 打通工具链,流程规范化自动化:多种手段+发布门禁助力质量提升:建立应用画像确定运维最小单元,可发 ...

  4. 研发效能|DevOps 已死平台工程永存带来的焦虑

    最近某位大神在推特上发了一个帖子,结果引来了国内众多卖课机构.培训机构的狂欢,开始贩卖焦虑,其实「平台工程」也不是什么特别高深莫测的东西.闲得无聊,把这位大神的几个帖子薅了下来,你看过之后就会觉得没啥 ...

  5. 「产品运营」研发效能之DevOps平台如何运营?

    有人常说「酒香不怕巷子深」.不是的,如果这个巷子是酒吧街,那最深的那家酒吧肯定是租金最便宜的.酒吧的地段好坏已经在租金价格上体现出来了.现在已经不是那个工具缺乏.有个工具就拍手称快.欣然去试用的时代了 ...

  6. DevOps | 如何快速提升团队软件开发成熟度,快速提升研发效能?

    今天一个小伙伴问我,如何「快速提升」一个团队的软件开发成熟度?我犯难了.我个人理解一个团队的软件开发成熟度涉及的东西很多,但最简单最直接的方法就是发钱涨工资,可是估计很多公司不愿意,那就只有扣了. 快 ...

  7. 研发效能|Kubernetes核心技术剖析和DevOps落地经验

    本文主要介绍Kubernetes 的核心组件.架构.服务编排,以及在集群规模.网络&隔离.SideCar.高可用上的一些使用建议,尤其是在CICD中落地,什么是 GitOps. 通过此文可彻底 ...

  8. 研发效能生态完整图谱&DevOps工具选型必看

    本文主要梳理了研发效能领域完整的方向图谱以及主流工具,其中对少部分工具也做了一些点评.看了之后,大家可以对研发效能这个领域有个整体认识,同时研发效能落地的时候也有对应的工具(黑话叫抓手)可以选择. 我 ...

  9. 研发效能之技术治理&技术治理架构师

    最近很多公司专门设置了一个职位叫「技术治理架构师」,主要负责公司技术治理相关事宜.这是个非常有意思的职位.技术治理的活,之前我们也是做的,只是没有提的这么明确,一般都是研发效能团队.PMO.架构团队. ...

  10. Serverless 对研发效能的变革和创新

    作者 | 杨皓然(不瞋) 对企业而言,Serverless 架构有着巨大的应用潜力.随着云产品的完善,产品的集成和被集成能力的加强,软件交付流程自动化能力的提高,我们相信在 Serverless 架构 ...

随机推荐

  1. 30day_网络编程

    由于不同机器上的程序要通信,于是产生通信 C/S架构: Client与Server,客户端(只有用的时候再使用)与服务端(一直运行,等待服务) B/S架构: 浏览器端与服务器端 Browser浏览器, ...

  2. 06 HBase安装与伪分布式配置

    1.下载压缩文件 2.解压 3.修改文件夹名 4.修改文件夹权限 5.配置环境变量 6.伪分布式配置文件 7.启动HDFS,启动Hbase 8.进入shell界面 9.停止Hbase,停止HDFS运行

  3. wait_event_interruptible() 等待队列

    在Linux驱动程序中,可以使用等待队列(Wait Queue)来实现阻塞进程的唤醒. 1.定义"等待队列头部" wait_queue_head_t my_queue; wait_ ...

  4. ES2015常用知识点

    ES2015(又称ES6)部分1 let/const以及块作用域:2 循环语句 const arr=[1,2,3]; for(const item of arr){ console.log(item) ...

  5. 优先使用C++的别名声明(using)来替换typedef

    C++98中,我们如果想用简写的方式表达一个类型,那么可以使用typedef关键字: typedef std::unique_ptr<std::unordered_map<std::str ...

  6. 查看app包名

    操作步骤: 1.cmd中输入命令:adb shell am monitor 2.启动需要获取包名的应用

  7. Pytorch中tensor的打印精度

    1. 设置打印精 Pytorch中tensor打印的数据长度需要使用torch.set_printoptions(precision=xx)进行设置,否则打印的长度会很短,给人一种精度不够的错觉: & ...

  8. 编译GO报错:cgo: C compiler

    cgo: C compiler "gcc" not found: exec: "gcc": executable file not found in %PATH ...

  9. mysql5.7_win64位安装

    1.下载MySQL压缩包解压缩 2.更改my.ini配置文件 [mysqld] #设置3306端口号 port=3306 #设置MySQL的安装目录 basedir=F:\\JavaSoftware\ ...

  10. var 和let const的区别

    var 是ES5语法,let,const是ES6语法,var存在变量提升. let const有块级作用域,var没有