在公司兼做了接近两年的远程运维工作,与内部打交道的过程中听到各种各样的话, 简单摘列一下那些似曾相识的愿意.不愿意听到的话: ”先别操作,帮忙先拷贝日志!我们调查一下答复!“  vs  ”你先重启一下xx程序, 看能不能好?” “有可能是我们的问题, 我先确认一下给你回复!”  vs  看也没看就说: “你和客户说这应该不是我们的问题!” “我们发现了一个新的问题, 发布了补丁, 帮忙把现场设备升级一下!”  vs  “哦, 我们知道有这个问题的! 我给你补丁, 你现在升级一下就好了!” ”这个…
前言 这几天打算利用碎片时间读了一下"SRE Google运维解密"这本书,目前读了前几章,感觉收获颇多,结合自己的工作经历和书中的要点,写一些感悟和思考 SRE 有关SRE我就不多介绍了,中文名字叫站点可靠性工程师,它的由来是google想通过软件工程师来解决复杂运维问题. 它里面有很多有意思的点,比如: 运维工作只能占比工作时间50% 另外50%要开发工具解决问题 SRE和开发工程师会轮岗 这些相关概念网上很多都介绍了,我就不赘述了,我说下一些我感兴趣的点 谷歌神话 谷歌一直在技术…
运维人的神技 运维既是个技术活儿也是个苦差事,而运维人员被期望有着无限的技能:主机.存储.网络.操作系统样样精通,而且还要会写SQL.shell.开发语言java..net.python等等,对业务更是门清,对各个用户的脾气喜好也要了如指掌. 除了广阔的知识面,强大的技术能力,沟通协调的能力,还需要拥有超强的耐心.谨慎的态度以及强健的体魄. 运维人的痛 人手有限,往往身兼数职(网管.项目管理.协调厂商.DBA.应用.写报告),既有很多协调性的管理工作,又有一些专业技术工作,尤其是数据库,短时间是…
去年,GOPS全球运维大会在深圳出发,当时门票提前几周收盘,2017年,承载着运维人的期望,GOPS全球运维大会再次来到了深圳.第六届GOPS2017全球运维大会深圳站(本次)将于2017年4月21日-22日在深圳举行,历届金牌讲师精选亮相,各种精彩等您发掘.下面和活动家一起来盘点GOPS2017全球运维大会嘉宾! (该场会议报名火爆,可能提前截止报名,如您需要参加,请尽早通过活动家在线报名.快捷报名:http://www.huodongjia.com/event-231365274.html)…
  对于我们这些刚入门的运维小白来说,极强的好奇心总会驱使我们去涉猎各种技术,弄到最后很可能该学的知识半懵半解,知识体系混乱,学习毫无章法.因此,我们学习 时要有一个明确的目标和知识体系(也是我学习的目标),下面大概向大家介绍以下优秀的运维人员应当具备哪些技能: 1.Linux系统基础入门-Linux的基础知识内容,和命令使用,以及用户和权限等核心知识点 2.Linux 系统管理和进阶-Linux从进程.资源.任务.文件.软件包.磁盘等管理方法 3.Linux 企业级常用服务如DNS.FTP.H…
(深度好文)重构CMDB,避免运维之耻 CMDB,几乎是每个运维人都绕不过去的字眼,但又是很多运维人的痛,因为CMDB很少有成功的,因此我也把它称之为运维人的耻辱. 那么到底错在哪儿了?该如何去重构它? 今天我想从我的角度来和大家探讨一下业务失败的原因,基于失败再去看重构的逻辑,也许会成功. 从失败中寻找成功的逻辑,往往是最有效的,那我们就来逐一看看: 1.组织的设计问题 我必须把核心原因归结成这一条,很多公司把CMDB的建设责任放到基础设施建设部门,由他们主导承建.最后他们梳理出来的核心逻辑是…
关注嘉为科技,获取运维新知 什么是PaaS平台型IT自动化运维&运营模式 PaaS平台型IT运维和运维模式是指:将通用的运维能力与具体的运维场景解耦合,将能够复用的,具备独立功能的通用能力纳入PaaS体系,并在PaaS体系基础之上针对多种多样的运维场景构建对应的运维工具APP. 让我们举个栗子来说明这个问题. 如下所示,开新区.故障替换和版本发布是我们在应用运维过程中具体的三个场景,我们把这三个场景的运维流程拆分之后,会发现这三个流程中用红色方框框起来的运维节点都是跟资源的配置信息打交道,那我们…
在我们日常的运维工作中,面对着大量的基础设施和软件服务,该如何管理?这个管理的原则又是什么?粒度该如何控制?我们是否可以建立一个统一的标准模型来管理以上对象?管理过程中,如何降低人力成本?资源对象的生命周期管理如何实现?这么多的疑问,所有的运维人都会想到ITIL中的CMDB.的确CMDB在ITIL中应该算是一个核心概念,以它为基础,才能构建起相关的其他运维活动,因为所有的活动都需要与这个CMDB平台交互.在CMDB构建的过程中,都会碰到如上的问题. 记得我刚刚做运维去建设CMDB的时候,觉得非常…
CMDB,几乎是每个运维人都绕不过去的字眼,但又是很多运维人的痛,因为CMDB很少有成功的,因此我也把它称之为运维人的耻辱. 那么到底错在哪儿了?该如何去重构它? 今天我想从我的角度来和大家探讨一下业务失败的原因,基于失败再去看重构的逻辑,也许会成功. 从失败中寻找成功的逻辑,往往是最有效的,那我们就来逐一看看: 1.组织的设计问题 我必须把核心原因归结成这一条,很多公司把CMDB的建设责任放到基础设施建设部门,由他们主导承建.最后他们梳理出来的核心逻辑是面向基础设施资源的管理,你在他们的CMD…
关于Oracle运维的重要性,随便写了几句,放在这儿和大家共勉. Oracle数据库在RDBMS中独占熬头,07年统计其市场份额占关系数据库市场的48.6%稳居首位,而且逐年增加,上升势头强劲.在使用过程中表现出来的灵活性尤为突出,由于其灵活性大,因此往往需要人为干预的事情也就相对较多,这样在没有专业人士维护的情况下其表现出来的稳定性似乎有些差强人意,甚至有很多人对oracle数据库持有怀疑的态度,说oracle不如其他数据库:象sql server使用起来方便.稳定,其实不是这样,这里我以一个…