读SRE Google运维解密有感(二)】的更多相关文章

前言 这是读“SRE Google运维解密”有感第二篇,第一篇参见 这本书最近又读了几章,结合自己的经历,有些地方真的能感同身受,有些地方也惊叹SRE充满辩证的思想,总之SRE是好一本好书,会给你很大的启发. 充满辩证的思想 本书主要是讲通过SRE思想进行运维体系的构建,除了技术层面以外,我更关注SRE内在充满辩证的思想. 一个辩证的思想是凡事都有两面性,这个道理很简单,大家一听就说“对啊,这不是废话么”,可是面对具体问题的时候,有时候往往做不到这一点. 服务太稳定不好 “什么?我有没有听错”,…
前言 这是读“SRE Google运维解密”有感第四篇,之前的文章可访问www.addops.cn来查看.今天我们来聊聊“问题排查”这个话题,本人到目前为止还在参与一线运维的工作,遇到过很多“稀奇古怪”的线上故障和问题,结合SRE中给出的一些方法,来说说“问题排查”那点事. 排查问题不是玄学 排查出线上问题,并找到根本原因加以解决,是一件很有成就感的事情,曾经有人问过我,“你是怎么想到问题出现在xxx的?又是怎么确认根本原因是xxx的?”,我只能淡淡的说:“靠经验”,然后感觉这个逼装的自己还算满…
前言 这是读“SRE Google运维解密”有感第三篇,之前的文章可访问www.addops.cn来查看.我们今天来聊聊“on call”也就是运维值班制度, 本人到目前为止也还在参与一线运维的值班,对运维值班体系也有一些感悟和心得,再参考SRE的“on call”中的方法来说说这个让运维同学“又爱又恨”的值班. 值班 因为运维人员的工作性质,要时刻保障线上服务的稳定可用,遇到事故问题要第一时间处理,所以很多运维团队的工作必须是7x24小时的. 但是人不是机器,他需要休息,也要有生活,所以不能要…
前言 这几天打算利用碎片时间读了一下"SRE Google运维解密"这本书,目前读了前几章,感觉收获颇多,结合自己的工作经历和书中的要点,写一些感悟和思考 SRE 有关SRE我就不多介绍了,中文名字叫站点可靠性工程师,它的由来是google想通过软件工程师来解决复杂运维问题. 它里面有很多有意思的点,比如: 运维工作只能占比工作时间50% 另外50%要开发工具解决问题 SRE和开发工程师会轮岗 这些相关概念网上很多都介绍了,我就不赘述了,我说下一些我感兴趣的点 谷歌神话 谷歌一直在技术…
1.运维团队与开发团队的矛盾: 运维追求业务的稳定.开发更关注新功能的添加与版本的快速迭代.但是由于业务更新,有很大可能导致故障.从本质上来说,两部门是矛盾的. deops应该是: 1.对重复性工作有天然排斥感 2.有足够能力快速开发软件系统来代替手工操作 sre团队职责:可用性改进.延迟优化.效率优化.性能优化.变更管理.监控.紧急事务处理.容量规划与管理 2.告警系统: 监控系统不应该要人来去分析告警信息,而是要告诉人要做 3.sre要密切关注系统的性能和资源利用率,进而改进资源利用率,降低…
# 第IV部分 管理 #系统可用性时间表 # 专用术语 SLO:服务等级目标 LCE(Land-Covered Earth):紧急检修登陆艇 # 紧急事故管理 一次流程管理良好的事故 # 东西早晚要坏的,这就是生活 # 值得警惕的是,理解一个系统应该如何工作并不能使人成为专家.只能靠调查系统为何不能正常工作才行. --Brian Redman # 系统正常,只是该系统无数 异常情况下的一种特例. --John Allspaw…
saltstack自动化运维系列⑩SaltStack二次开发初探 1.当salt运行在公网或者网络环境较差的条件下,需要配置timeout时间vim /etc/salt/master timeout: 60 2.salt-minion的单机模式:修改配置文件:# vim /etc/salt/minion file_client: local # /etc/init.d/salt-minion stop 本地命令测试# salt-call --local test.pinglocal: True…
近年来,CMDB在IT运维管理中的价值逐步得到认可,使用CMDB的期望值也日益增长.然而,CMDB实施和维护的高成本却一直是建设者们的痛点.那么今天,我们来探讨一下如何通过消费来持续驱动CMDB的逐步完善. 消费驱动是指依托用户消费的收益,吸引研发者.销售者,逐步围绕该产业开展建设并延伸拓展其发展范畴.举例来说,网购的消费方式驱动了电商的蓬勃发展,新型的生活模式驱动了职能家居的研制.借鉴这一思路,我们不妨通过加强CMDB的消费落地,场景化其应用效益,来驱动管理者和使用者更加重视配置管理,从而投入…
Ajax基础 AJAX 不是新的编程语言,而是一种使用现有标准的新方法. AJAX 是与服务器交换数据并更新部分网页的艺术,在不重新加载整个页面的情况下. 什么是Ajax AJAX = 异步 JavaScript 和 XML,是一种用于创建快速动态网页的技术. 通过在后台与服务器进行少量数据交换,AJAX 可以使网页实现异步更新.这意味着可以在不重新加载整个网页的情况下,对网页的某部分进行更新,传统的网页(不使用 AJAX)如果需要更新内容,必需重载整个网页面.       概括:AJAX 是一…
运维人员远控电脑询问IP时,总要告诉用户找ip的步骤,岂不很烦? 以下方法直观地把ip地址显示在桌面上,再做个入职培训,即可提高运维效率. 1.  下载bginfo.exe软件,放到域控下的netlogon文件夹下,并在netlogon目录下创建bginfo.bmp文件:     https://pan.baidu.com/s/1i4JSUc1 2.  打开bginfo文件,选择需要显示到桌面的选项,然后另存为到netlogon目录下,如下图: 3.   设置域控组策略,从共享文件夹复制bgin…