在团队纷纷谈起工作效率的时候,对运维工作者,他们通常喜欢用「故障的平均解决时间」来衡量团队的工作效率.然而这往往是不正确的.一个迅速解决大量突发事故的团队十分高效,而实际上这更有可能意味着该团队的基础设施十分脆弱易损.那我们应该使用什么标准来衡量团队的工作效率呢? 本文系国内 ITOM 管理平台 OneAPM 翻译整理自Dan Turchin 2015 撰写的文章 <What is MTTR?Or why not to feed the baby cognac>, MTTR(平均恢复前时间)是…
实例恢复时间:指的是将数据文件的最后一个检查点(检查点位置)推进到控制文件中记录的最新SCN 所需的时间.管理员可以通过设置MTTR 目标以及调整重做日志组的大小来控制该时间.MTTR 指导:Mean Time To Repair,即平均修复时间.是指可修复产品的平均修复时间,就是从出现故障到修复中间的这段时间.MTTR 越短表示易恢复性越好.在数据库中可以通过设置参数FAST_START_MTTR_TARGET(单位为秒),控制数据库对单个实例执行崩溃恢复所花费的时间.FAST_START_M…
一般来说,对于设备的关键性指标的统计,国际惯例中有三个指标用来进行统计,它们分别是: MTTR(Mean Time To Repair),平均修复时间.计算方法是:总的故障时间/故障次数.计算公式为:MTTR =∑(T2+T3)/ N.MTTR越短表示易恢复性越好. MTTF(Mean Time To failures),平均故障时间.计算方法是:总的正常运行时间/故障次数.计算公式为:MTTF =∑T1/ N.该值越大,表示系统的可靠性越高,平均无故障时间越长. MTBF(Mean Time…
HBase介绍 HBase是Hadoop Database的简称,是建立在Hadoop文件系统之上的分布式面向列的数据库,它具有高可靠.高性能.面向列和可伸缩的特性,提供快速随机访问海量数据能力. HBase采用Master/Slave架构,由HMaster节点.RegionServer节点.ZooKeeper集群组成,底层数据存储在HDFS上. 整体架构如图所示: HMaster主要负责: 在HA模式下,包含主用Master和备用Master. 主用Master:负责HBase中RegionS…
实验目的:Oracle直接拷贝物理文件迁移,生产库有类似施工需求,故在实验环境简单验证一下. 实验环境: A主机:192.168.1.200 Solaris10 + Oracle 11.2.0.1 B主机:192.168.1.186 Solaris10   1.备份ORACLE安装包($ORACLE_BASE目录) tar cvf oracle.tar oracle   2.关库,备份参数文件,控制文件,数据文件,临时文件,日志文件 查看各个文件的存放路径: SQL> show paramete…
ORA-00001: 违反唯一约束条件 (.) ORA-00017: 请求会话以设置跟踪事件 ORA-00018: 超出最大会话数 ORA-00019: 超出最大会话许可数 ORA-00020: 超出最大进程数 () ORA-00021: 会话附属于其它某些进程:无法转换会话 ORA-00022: 无效的会话 ID:访问被拒绝 ORA-00023: 会话引用进程私用内存:无法分离会话 ORA-00024: 单一进程模式下不允许从多个进程注册 ORA-00025: 无法分配  ORA-00026:…
敏捷发展到今天已经在软件行业得到了广泛认可,但大多数敏捷方法都是为了解决某一特定问题而总结出来的特定方法或实践,一直缺乏一个可以将整个开发过程串接起来的成体系的方法.用户故事驱动的敏捷开发(User Story Driving Agile Development – UDAD)就是这样一套方法和实践,希望能够在软件开发的各个过程都提供最有效的方法让希望采用敏捷的团队能够有一个整体的方法论作为指导. 如何你对敏捷还缺乏了解,可以阅读以下文档: 关于敏捷开发 UDAD中采用了以下几个已经被广泛认可的…
通信中KPI,是Key Performance Indicators的缩写,意思是关键性能指标.performance 还有绩效:业绩的意思,但显然不适用于这种场合. 通信中KPI的内容有:掉话率.接通率.数据业务下载速率.网络质量现场测试与竞争对手领先程度.网络投诉总量同比完成情况等. =========================================================== 话统 呼叫建立类 1.RRC连接建立成功率RRC连接建立成功率(业务相关)=RRC连接建立…
第一章 ADDM简介                 在Oracle9i及之前,DBA们已经拥有了很多很好用的性能分析工具,比如,tkprof.sql_trace.statspack.set event 10046&10053等等.这些工具能够帮助DBA很快的定位性能问题.但这些工具都只给出一些统计数据,然后再由DBA们根据自己的经验进行 优化.         那能不能由机器自动在统计数据的基础上给出优化建议呢?Oracle10g中就推出了新的优化诊断工具:数据库自动诊断监视工具(Automa…
常见质量属性 1.性能 性能就是一个东西有多快,通常指响应时间或延迟. 响应时间:从发出请求到收到响应所用的时间,比如用户点击网页中的超链接或桌面应用程序中的按钮 延迟:消息从A点到B点,通过你的系统所用的时间. 就算构建的不是“高性能”软件系统,性能也可应用于Web应用系统.桌面应用系统.面向服务架构.消息系统等几乎所有你要构建的软件系统. 2.可用性 可用性是软件对服务请求的可操作和可见程度.你常会看到用“9”来衡量或指代可用性,如99.99%(四个9)或99.999%(五个9).这些数字指…