一直想努力向别人(甚至包括从事运维的人)解释清楚什么是运维,发现很难! 6月20号,在InfoQ高效运维群里面,对运维创业做了一次激烈的讨论,很自然地,过程中不可避免的谈到运维苦逼和运维无法产品化的问题,这是一些运维需要说服自己,证明自己价值的问题.对于本人来说,运维的价值不容置疑,只要我们运维人能自我认识突破,更体系化的站在业务角度看待运维价值问题,那我们就不是一个苦逼的成本部门.此时我自然的想到了[IT运营],它带来的视界会更加开阔,能够帮助更好的重新认识运维. 一.运维是什么 运维从IT软…
大数网 吴玉征 先说个真实的故事. 前一段时间,有一家知名的国际连锁咖啡公司的自助交易系统(支付宝.微信.ApplePAY)特别慢,工作人员也不知道为什么.由于他们刚上了业务运维,支持这套系统的云智慧后台管理人员通过数据一层层梳理,最后确定到某个区域的某个数据中心的某一块硬盘缓存溢满,导致交易变慢.找到并解决问题之后,该咖啡连锁店一下午挽回好几万笔的交易数. 为什么这么大量?因为一旦手机支付存在问题,大量用户排队使用POS机支付,耽误了时间也耽误了效率.这家公司在全国有近2000家门店,都在使用…
企业该如何进行高效IT运维管理 在企业内部也是一样,当大量的生产和经营数据集中在数据中心,一旦人们与数据中心因为IT故障而失去联系,停滞的也许不是个人应用受阻这样简单的后果.我们谁也不想看到自己企业的数据中心停滞不前,那么当中的IT运维管理就变得十分重要了,笔者就和大家来聊聊云计算架构当中,企业该如何进行高效的IT运维管理. IT运维管理需要改变 相比传统的IT运维管理模式来说,云计算大环境下,企业在IT设备采购和方案部署等诸多环节都需要进行改进和提升,在未来的大型云计算数据中心面前IT运维人员…
摘要:本文从单机真机运营的历史讲起,逐步介绍虚拟化.容器化.Docker.Kubernetes.ServiceMesh的发展历程.并重点介绍了容器化阶段之后,各项重点技术的安装.使用.运维知识.可以说一文讲清楚服务器端运维的热点技术. 序 文章的名字起的有点纠结,实际上这是一篇真正从基础开始讲解,并试图串联起来现有一些流行技术的入门文章. 目前的企业级运营市场,很有点早几年前端工程师所面临的那样的窘境.一方面大量令人兴奋的新技术新方案层出不穷:另外一方面运维人员也往往陷入了选择困局,艰于决策也疲…
摘要: 从用户的声音中,我们听到用户对稳定.弹性.透明的诉求,我们也在不断升级ECS的运维能力和体验,助力用户建立主动运维体系,赋能业务永续运行.为了让大家更好的了解和用好ECS弹性计算服务,从本期开始,我们会以专栏的形式不断更新ECS运维方面的内容,也欢迎大家多提宝贵建议和意见,帮助我们打造更好的弹性计算服务. 阿里云经过9年多的发展,成长为中国第一全球前三的云服务提供商,为上百万用户提供IT基础设施云服务.这些用户几乎都会使用ECS弹性计算服务,这其中既有面向消费者(to C).企业(to…
很久没有写KM了,最近lester这边在梳理CDB这边存在的问题,并推动那些问题解决措施的落地.无疑当前CDB存在比较多的问题,也有很多坑.需要我们运维和开发的同学多思考问题的根源和解决办法,并付诸实践,成为问题的终结者,而不是成为一个会发现问题而不知道解决问题或者只是一个制造问题的人.通过最近对CDB运维兄弟们的观察,发现大家做事情的思路和执行力有了很大的提高.这里通过一个case来分享一下关于做事的一些想法. 事情的起因是由于同事调岗lester这边在接手和梳理内部CDB的相关业务,在接手的…
第一章 系统基础信息模块详解 系统基础信息采集模块最为监控模块的重要组成部分,能够帮助运维人员了解当前系统的健康程度,同时也是衡量业务的服务质量的依据,比如系统资源吃紧,会直接影响业务的质量以及用户的体验,另外获取设备的流量信息,也可以让运维人员更好地评估带宽.设备资源是否应该扩容. 本章通过具体的实例来帮助读者学习.理解并掌握.在本章接下来的内容中,可以通过运用Python第三方系统基础模块,获取服务关键运营指标数据,其中包括Linux基本性能.块设备.网卡接口.系统信息.网络地址库等信息.当…
一.简介 原创:梁鹏 本文是根据魅族系统架构师梁鹏10月20日在msup携手魅族.Flyme.百度云主办的第十三期魅族技术开放日< 魅族CMDB运维自动化实践>演讲中的分享内容整理而成. 内容简介:本文主要从运维自动化发展历程.CMDB运维的痛点.CMDB运维自动化实践.后续发展和演进四个方面介绍了CMDB运维自动化实践. 运维自动化发展历程 随着移动互联网的发展,运维平台的架构也在不断演进和优化,给运维人员带来了诸多挑战.首先从质量上看,不管是硬件还是架构,由于监控体系不完善,导致覆盖率低,…
应用迁移需求 应用运维需要考虑的一个重要问题就是迁移, 在不同机器.机房.环境间迁移.迁移的原因有很多, 比如硬件过保(硬件故障), 机房迁移, 应用扩缩容等. 应用迁移的核心需求是: 简单.迁移操作必须足够简单, 没有学习成本, 点击一下即可. 快速.迁移过程能在极短的时间内完成. 无损.迁移之后应用与原应用一模一样, 不丢失任何配置和数据.迁移之后应用功能和业务逻辑与原部署应用一模一样,无任何业务风险. 许多公司还在使用古老的 rhel 5/6 和 linux 2.6.x 内核, 难以充分发…
运维概述:运行 & 维护,Operation & MaintanceIT运维.业务运维.日常管理运维采用相关的方法.手段.技术.制度.流程和文档等,对IT运行环境.IT业务系统和IT运维人员进行的综合管理. 传统运维技术特点:单一化:业务及服务单一简单化:部署的服务与架构相对简单被动化:出现问题后,救火式的管理 linux运维最佳实践集中化自动化分布式标准化虚拟化... ... ------------------------------------squid代理 代理服务器分类:正向代理…