子曰“干的最好就是个60分,稍有纰漏就是不及格”

谈一个事情,最先要谈的就是统一标准,又或者这个标准已经约定俗成,广泛认可,所以就可以略过。对于IT服务质量来说,确实有一个统一的标准,那就是上面的那个子曰:“干的最好就是个60分,稍有纰漏就是不及格”。可悲的是虽然无论基层技术人员、中层管理人员、高层管理人员,甚至是旁观者来说,都不觉得这个标准是非常合理的,但是在实践当中,大家又都不自觉的执行着这个标准。真是有够虐心的。

有一些高速发展的中小型互联网企业,为了保证技术团队的积极性,对运维事故表现出很高的宽容度。但是,这不代表老板心中没有看法,所以实际上标准还是那个“子曰”。

在这种畸形标准的制约下,很多企业(特别是有钱企业)的IT服务管理走向了一条为了表现“已管理”,而进行管理的邪路。其本质原因是,在运维过程中,事故是难以完全避免和杜绝的。但领导的期望又是杜绝事故,那对于中层管理人员和基层技术人员来说,唯一能做的就是让领导相信,“我们把能想到的都做了,再出事那就是天灾人祸”。

说这个问题以前,我想先拿传统企业来做对比。传统企业比较典型的有产品开发部门、生产部门、市场和宣传部门、销售部门、售后维护部门,还有其他一些保证企业运行或发展的平台部门。对于一个以信息化(网上、手机上)服务作为主要业务提供模式的企业来说,和传统企业相关部门的对应关系是,软件开发部门对应到产品开发部,市场宣传部门和销售部门几乎没变(可能营销方式不同),售后部门基本没变,平台部门基本也没变,那么IT运维部实际对应的是传统企业的生产部门。想通这个问题很重要,因为实际上许多企业仍然按照传统的模式,把IT运维部门对应到平台的某个部门当中。平台部门是纯粹的成本部门,做的事情单一、重复率高,自然不允许犯错。但是,如果是生产部门,则另当别论,生产部门需要面临不同的原材料(IT运维往往要面临不同的数据和有缺陷的软件),承担巨大的生产压力,其实高层管理者,往往喜欢用成本利润的方式来考核生产部门。不出事不是最重要的,关键是事故可控,以及控制事故的成本低于所能获得的利润。

有了这个对比就清晰多了,即然IT运维部门对于一个企业来说是生产部门,那么管理者更应该关注的是能接受的IT服务质量和成本是什么,以及哪种类型(或严重程度)的事故是不能接受的。我曾经接触过一个客户,他们列出了不能接受的几类事故(例如:大量数据丢失、安全泄密、长时间故障不能恢复等),同时列出了能接受的服务质量(例如:可用率指标、服务响应时间指标、故障响应时间指标、知识管理指标等)。这种比较清晰的、可量化的指标体系,可以保证IT服务管理有的放矢。那么基于这些指标,IT服务管理者就可以选择合适的流程和工具,保证关键和重要指标的满足,同时也可以考虑节约成本的方法和途径。同时,也能避免“干的最好就是个60分,稍有纰漏就是不及格”。只要指标满足了,就是个100分。没满足,那么可以根据指标的权重计算分值,当然了出了不可接受的事故,就是不及格。

没有规矩不成方圆,我强烈建议,任何一个准备提升IT服务质量的企业,先根据自身的业务需求,列出(或回顾)完整的IT服务指标。同时,这些指标也可以作为SLA(Service-Level Agreement)管理的基础。

IT服务(运维)管理实施的几个要点--第一章 IT服务质量的标准的更多相关文章

  1. IT服务(运维)管理实施的几个要点--第二章 人员和组织架构

    子曰"没有合适的人" 在流程化的管理模式下,最容易步入的一个误区是按流程设计一个"理想的"组织架构,然后对应于这个架构对人员进行评估.培养,甚至是更换.我见过很 ...

  2. IT服务(运维)管理实施的几个要点--序言

    IT服务(运维)管理(不是IT运维技术)是IT行业当中相对比较"窄"的一个分支,通常只被金融.电信等大型数据中心的中高层管理人员所关注.但是根据笔者多年从事IT服务和服务管理的经验 ...

  3. 《Ansible自动化运维:技术与佳实践》第一章读书笔记

    Ansible 架构及特点 第一章主要讲的是 Ansible 架构及特点,主要包含以下内容: Ansible 软件 Ansible 架构模式 Ansible 特性 Ansible 软件 Ansible ...

  4. 企业该如何进行高效IT运维管理

    企业该如何进行高效IT运维管理 在企业内部也是一样,当大量的生产和经营数据集中在数据中心,一旦人们与数据中心因为IT故障而失去联系,停滞的也许不是个人应用受阻这样简单的后果.我们谁也不想看到自己企业的 ...

  5. ylbtech-KeFuYunWei(服务运维考核系统)-数据库设计

    ylbtech-DatabaseDesgin:ylbtech-KeFuYunWei(服务运维考核系统)-数据库设计 DatabaseName:KEFUYUNWEI Model:Admin 用户后台管理 ...

  6. 系统批量运维管理器Fabric详解

    系统批量运维管理器Fabric详解 Fabrici 是基于python现实的SSH命令行工具,简化了SSH的应用程序部署及系统管理任务,它提供了系统基础的操作组件,可以实现本地或远程shell命令,包 ...

  7. 不吹不黑,赞一下应用运维管理的cassacdra

    不吹不黑的为菊厂的应用运维管理AOM点个赞.Why? 某菊厂应用运维管理工具AOM每天处理着亿级条数据,这么多数据是怎么存储的呢? 说到数据存储就会想到关系型数据库,比如mysql,oracle,sy ...

  8. Linux运维入门到高级全套常用要点

    Linux运维入门到高级全套常用要点 目 录 1. Linux 入门篇................................................................. ...

  9. 15-MySQL DBA笔记-运维管理

    第15章 运维管理 随着各种技术的快速发展,现今的DBA可以比以前的DBA维护多得多的数据库实例.DBA已经越来越像一个资源的管理者,而不是简单的操作步骤执行人.本章将为读者介绍规模化运维之道.首先, ...

随机推荐

  1. anaconda spyder异常如何重新启动

    电脑有一次断电,重新启动后anaconda的spyder就打不开了 重新启动spyder方法: 在anaconda安装目录的Scripts文件夹下,shift+右键在此窗口打开命令行,运行spyder ...

  2. django事务处理

    #导包 from django.db import transaction try: #django默认是自动提交到数据库,此处设置不让其自动提交 transaction.set_autocommit ...

  3. hibernate第二天

    hibernate的核心思想就是将之前对单个字段的操作变为操作一个对象,使用了ORM(Object relation mapping)对象关系映射的思想 · 在hibernate中对数据库特殊字段的有 ...

  4. dp资源分配问题

    noip考试中dp中的资源分配问题是一大重点(不定时更新) 以下是一些例题 1.乘积最大 //Gang #include<iostream> #include<cstring> ...

  5. Elasticsearch JAVA api搞定groupBy聚合

    本文给出如何使用Elasticsearch的Java API做类似SQL的group by聚合.为了简单起见,只给出一级groupby即group by field1(而不涉及到多级,例如group ...

  6. Linux多进程编程实例

    前言:编写多进程程序时,我们应该了解一下,创建一个子进程时,操作系统内核是怎样做的.当通过fork函数创建新的子进程时,内核将父进程的用户地址空间的内容复制给子进程,这样父子进程拥有各自独立的用户空间 ...

  7. css3的动画特效--动画序列(animation)

    首先复习一下animation动画添加各种参数 (1)infinite参数,表示动画将无限循环.在速度曲线和播放次数之间还可以插入一个时间参数,用以设置动画延迟的时间.如希望使图标在1秒钟后再开始旋转 ...

  8. pku 2488 A Knight&#39;s Journey (搜索 DFS)

    A Knight's Journey Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 28697   Accepted: 98 ...

  9. Tomcat下载,新建自己的项目,模拟server

    一.tomcat下载 下载地址http://tomcat.apache.org/ 打开网页能够看到例如以下内容 在网页左边有Download以下就是能够下载的版本号.如6.0,7.0,8.0: 选择一 ...

  10. 5. Effective Java 第三版——使用依赖注入取代硬连接资源

    Tips <Effective Java, Third Edition>一书英文版已经出版,这本书的第二版想必很多人都读过,号称Java四大名著之一,不过第二版2009年出版,到现在已经将 ...