平台工程是一种新兴的技术方法,可以加速应用程序的交付和产生商业价值的速度。通过提供具有自动化基础设施操作的自助服务能力,改善开发者的体验与生产力,同时降低操作的复杂性。在企业采用了平台工程之后,需要对平台工程的采用情况和结果进行追踪和衡量。当涉及到衡量平台工程的性能和有效性时,关键绩效指标(KPI)能够提供有价值的信息和见解。

在本篇综合指南中,我们将探索有关平台工程的重要 KPI,以及在企业为自己的平台工程确定 KPI 时可以参考哪些步骤和实践。

平台工程 KPI 的重要性

平台工程 KPI 对于企业十分关键,因为它能有效评估平台工程的有效性、性能和价值方面发挥着重要作用。我们总结了以下几点来解释平台工程 KPI 的对企业的重要性。

首先 KPI 提供了平台工程目标和目的的总框架。通过定义具体和可衡量的 KPI,企业可以将他们的平台工程战略与更广泛的业务目标联系起来。KPI 能够让项目中各个团队关注最关键领域,跟踪进展,并进行评估。同时,KPI 还是衡量平台工程工作绩效和有效性的基准。因为 KPI 能够提供可量化的指标,反映平台领域内各种活动和流程的结果和影响。例如可用性、响应时间、可拓展性、和开发人员满意度,KPI 都提供了客观数据,以衡量平台在实现其预期目标方面的情况。

KPI 还能促进平台工程中的数据驱动决策。KPI 能够提供客观的数据,因此企业在做决策时不用依靠主观的意见和想法。企业可以使用 KPI 来识别趋势、模式和相关性,以支持在资源分配、计划优先级和战略规划方面的选择。

现代企业在实现快速交付的同时,也在努力追求内部创新。KPI 对于培养平台工程的持续改进和创新文化也十分关键。通过长期跟踪 KPI,企业可以识别趋势,衡量变化和改进的影响。KPI 能够用来评估新技术、流程或方法的有效性,并支持识别创新,以推动进一步优化和差异化。此外,KPI 有助于使平台与利益关联者的期望和业务优先事项保持一致,企业可以证明平台工程在实现更广泛业务目标方面的价值。KPI 能够帮助实现有效的沟通和报告,确保平台工程的实施与企业战略保持一致。

有哪些值得关注的平台工程 KPI?

在这一部分,我们将列举一些值得关注的平台工程 KPI 以供参考。当然,企业在确定平台工程 KPI 前,需要确定明确的目标和目的。这些目标应当与企业的整体愿景和使命一致。通过定义具体和可衡量的目标,企业内部团队可以专注与其相关的指标。定义完目标后,就可以开始确定平台工程的 KPI 了,这里我们总结了一些平台工程 KPI 供企业参考。

交付时间

交付时间衡量的是软件从开发到能够交付的时间。这个时长包括对开发内容的探讨,在积压工作中等待的时长,以及软件从交付到发布所需的时长。如果企业交付时间过长,则表明流程当中的某个部分出现了故障,从而导致项目没有进展或进展缓慢。想要加速交付时间,平台工程团队可以尽可能自动化所有能够自动化的工作。当在回顾交付时间时,逐渐降低的交付时间则反映团队能够快速适应反馈并实现他们的目标。

部署频率

部署频率跟踪的是开发人员将代码部署到生产中的频率。这个指标是用来衡量软件工程团队是否能够为客户提供价值。无论工作流程多么完善,如果部署频率不够高的话,可能无法为客户提供足够的价值。高部署频率表明开发团队能够频繁地修改代码,提供新功能或特性并使其上线,表明开发团队正在有效地采用 CI/CD,且对基础设施有良好的掌握。

开发者幸福感

看起来好像把开发者幸福感和生产力放在一起讨论不太靠谱,但事实证明,开发者幸福感和生产力是呈正相关的。平台工程的具体目标是改善开发人员的体验,这就是为什么测量 DevX 指标很重要。

变更失败率(CFR)

变更失败率衡量的是部署到生产中失败的百分比。这个指标可以让企业清楚地看到软件质量和稳定性。用导致失败的部署数量除以总的部署数量就可以得到这个指标。通过长期监测这个指标,企业可以很好地了解有多少精力用于解决问题,有多少精力用于发布新代码。当它高于15%时,则表明团队可能花了太多的时间来修复问题,或者有一些流程需要改进。

平均恢复时间(MTTR)

平均恢复时间是另一个指标,该指标显示服务在中断后恢复正常运行的速度。即使是最好的 DevOps 团队,也会时常遇到意料之外的停机和问题。企业也许无法阻止故障的发生,但需要明确在故障发生后需要多长时间才能恢复运行。在确定这个 KPI 的时候,还需要加上在报告问题后部署一个补丁所需的时间。

成本可观测性

资源分配和使用效率是平台工程的支柱之一。清晰的了解钱花在哪里,可以帮助企业有效控制云成本。透明的成本 KPI 可以让开发团队和平台团队在部署前看到他们的架构设计对成本的影响,或者对云成本有一个整体的了解或认知。

企业如何选择合适的平台工程 KPI?

为平台工程选择正确的关键绩效指标需要仔细考虑,并与企业的目标和优先事项保持一致。企业可以参考以下实践步骤来为自己选择合适的平台工程 KPI。

首先,企业请确保所选择的 KPI 与业务目标和战略相一致。平台工程应支持并促进企业实现业务目标。考虑平台性能和效率如何影响企业的关键指标,将 KPI 与这些业务目标联系起来,这样也有助于向利益相关者展示平台工程的价值。

企业还需要确定平台工程的关键成功因素,这些是对平台的成功和性能有重大影响的领域。例如,可用性、可扩展性、安全性和用户满意度等因素在平台工程中往往十分重要。选择能够直接衡量和反映这些因素的 KPI。同时,企业需要考虑和研究与平台工程有关联的行业标准和最佳实践。目前业内暂无平台工程标准,因此大部分企业参照 DORA 指标来确定其平台工程 KPI。DORA 能够提供有价值的知道,并帮助企业在衡量绩效时也能符合行业预期。需要注意的是,KPI 应该根据组织的具体需求和目标进行调整。

在确定平台工程 KPI 时,让利益关联者也参与进来,例如平台工程团队、开发团队、产品团队等。了解他们的痛点,收集他们的观点和需求。了解不同利益关联者的期望和优先事项,确保所选的关键绩效指标能够直接有效地反映他们的需求。利益关联者的参与也有助于培养对所选 KPI 的责任感和认同感。

企业为其平台工程选择 KPI 时候,请选择可衡量的、能提供可操作见解的指标。所选择的指标应该是可靠的,容易跟踪的,并且与企业的数据收集能力相一致。考虑滞后指标(历史业绩)和领先指标(预测性措施),以获得对平台工程业绩的全面看法。同时,确保选定的 KPI 是具体的、明确的和可实现的。避免模糊或过于复杂的 KPI,因为这些指标可能难以衡量或解释。设定现实的目标和基准,可以进行有效的绩效评估,并有助于推动持续改进工作。

最后,必要情况下企业需对 KPI 进行定期审查和调整。KPI 不应该是一成不变的。定期审查选定的 KPI,以确保指标与不断变化的业务需求和优先事项保持一致。随着组织的发展,可能需要调整 KPI,或增加新的 KPI,以及时有效反映新的趋势或挑战。

请记住,KPI 的选择是一个动态的过程,尤其在目前没有权威平台工程 KPI 情况下,选定的 KPI 需要不断评估和完善。通过选择正确的KPI,企业可以有效地衡量平台工程性能,推动改进,并使其目标与企业愿景及业务目标保持一致。

总结

在平台工程的实施过程中,衡量成功和进展对寻求提供高效、可扩展和可靠平台的企业组织来说至关重要。KPI 提供了一种结构化和可量化的方法来评估性能,确定改进的领域,并支持数据驱动的决策。通过利用 KPI,企业可以培养一种持续改进的文化,使平台工程努力与业务目标保持一致,并在快速发展的数字环境中实现业务目标并获得商业价值。

综合指南|如何为平台工程选择关键 KPI的更多相关文章

  1. (译)综合指南:通过Ubuntu 16.04上从Source构建来安装支持GPU的Caffe2

    (译)综合指南:通过Ubuntu 16.04上从Source构建来安装支持GPU的Caffe2 译者注: 原文来自:https://tech.amikelive.com/node-706/compre ...

  2. 研发效能|DevOps 已死平台工程永存带来的焦虑

    最近某位大神在推特上发了一个帖子,结果引来了国内众多卖课机构.培训机构的狂欢,开始贩卖焦虑,其实「平台工程」也不是什么特别高深莫测的东西.闲得无聊,把这位大神的几个帖子薅了下来,你看过之后就会觉得没啥 ...

  3. 平台工程101:Dev、Sec和Ops的自动化黏合剂

    国际权威知名调研机构 Gartner 在<2023年最重要的10个技术趋势>报告中将平台工程(Platform Engineering)列为高速发展的技术趋势之一,并预测到2026年80% ...

  4. Seal AppManager发布:基于平台工程理念的全新应用部署管理体验

    4月12日,数澈软件Seal(以下简称"Seal")宣布推出新一代应用统一部署管理平台 Seal AppManager,采用平台工程的理念,降低基础设施操作的复杂度为研发和运维团队 ...

  5. DevOps、SRE、平台工程的区别

    DevOps.SRE和平台工程的概念在不同时期出现,并由不同的个人和组织开发. DevOps作为一个概念是由Patrick Debois和Andrew Shafer在2009年的敏捷会议上提出的.他们 ...

  6. 理解BERT:一个突破性NLP框架的综合指南

    概述 Google的BERT改变了自然语言处理(NLP)的格局 了解BERT是什么,它如何工作以及产生的影响等 我们还将在Python中实现BERT,为你提供动手学习的经验 BERT简介 想象一下-- ...

  7. Python Seaborn综合指南,成为数据可视化专家

    概述 Seaborn是Python流行的数据可视化库 Seaborn结合了美学和技术,这是数据科学项目中的两个关键要素 了解其Seaborn作原理以及使用它生成的不同的图表 介绍 一个精心设计的可视化 ...

  8. 工程和界面—Webstorm入门指南 Webstorm中的工程-备

    1.新建工程 “Quick Start”界面新建工程: 也可以点击顶部菜单栏“File”-> “New Project”. 弹出如下界面: “Location”指向想要创建的工程目录(如果该目录 ...

  9. 高德JS依赖分析工程及关键原理

    一.背景 高德 App 进行 Bundle 化后,由于业务的复杂性,Bundle 的数量非常多.而这带来了一个新的问题——Bundle 之间的依赖关系错综复杂,需要进行管控,使 Bundle 之间的依 ...

  10. C++ 几款IDE和编程平台的选择分析

    最近闲来无事,就研究了一下几个编程平台和IDE.首先,我必须强调一下,这些方案研究并不一定适用于商业公司内部编程平台选择,而是给个人学习或者闲暇之余把玩用的.主要从以下几个指标考量:使用体验.跨平台. ...

随机推荐

  1. ansible 命令行模

    ansible 命令行模 ansible命令格式 命令格式:ansible <组名> -m <模块> -a <参数列表> 查看已安装的模块 ansible-doc ...

  2. Mach-O Inside: 命令行工具集 otool objdump od 与 dwarfdump

    1 otool otool 命令行工具用来查看 Mach-O 文件的结构. 1.1 查看文件头 otool -h -v 文件路径 -h选项表明查看 Mach-O 文件头. -v 选项表明将展示的内容进 ...

  3. List集合异常:list All elements are null

    查询数据库,返回空数据,但是List中显示有一个数据,点开以后显示  All elements are null ObjectUtils.isEmpty 和 List.isEmpty判断都失败,后续会 ...

  4. 适合业余爱好者DIY的高精度数字电桥

    基本状况:工作频率: 100Hz,1kHz,7.813kHz最小分辨:最小分辨0.5毫欧,0.03uH,0.02pF最大分辨:G欧基本量程精度:1kHz基本量程精度,0.5%,选好电阻,精心制作,可以 ...

  5. How to write a proposal?

    Most students and beginning researchers do not fully understand what a research proposal means, nor ...

  6. windows11配置wsl2虚拟linux环境

    windows11配置wsl2虚拟linux环境 wsl( Windows Subsystem for Linux )是microsoft官方为windows开发的模拟Linux方法.避免了虚拟机vm ...

  7. 一种全新的日志异常检测评估框架:LightAD

    本文分享自华为云社区<[AIOps]一种全新的日志异常检测评估框架:LightAD,相关成果已被软工顶会ICSE 2024录用>,作者: DevAI. 深度学习(DL)虽然在日志异常检测中 ...

  8. 提升效率,打通万里牛ERP与下游用友U8财务软件的无缝对接

    一.对接流程 1.1 销售/售后流程 在万里牛订单出库后,通过轻易云数据集成平台将数据推送至用友U8销售订单和销售出库单,这些单据可以进行关联操作. 当万里牛售后单完成退货入库后,通过数据集成平台将数 ...

  9. [python] 基于Tablib库处理表格数据

    Tablib是一个用于处理电子表格(如 Excel,CSV,JSON)的Python 库.它提供了一种简单而强大的方式来操作和处理数据.利用Tablib,我们可以轻松地读取.写入.过滤和转换各种类型的 ...

  10. Opencv学习笔记(2)

    图像处理是图像识别过程中重要一环,一张图像可能包括海量的不明确的信息,图像处理的目的是消除图像中无关的信息,恢复有用的真实信息,增强有效信息的可检测性,最大限度地简化数据. 参考知乎文章链接:http ...