AIOps是一个总称,用于指代使用复杂的基础设施管理软件和云解决方案监控工具来实现自动化数据分析和日常的DevOps操作。

那些10年前甚至是5年前构建的系统监控工具的主要缺陷是它们不是为了满足大数据时代的需求而构建的。它们既不能处理数量庞大的输入数据,也不能处理种类繁多的数据类型,更加不能与输入数据的速度保持一致。根据以往的经验,这样的云监控解决方案必须将数据分块,将看似重要的内容进行分离,并切断看似不需要的内容,最后使用焦点组和统计样本进行操作,而不是处理整个完整的数据。

这样做的结果是,在数据分析阶段,一些重要的模式可能会被忽略,数据可视化的视图被完全排除。这可能使得整个过程毫无用处,就好像大数据分析不能产生可操作的业务洞察一样,它将无法提供大数据分析中最重要的价值。

让AIOps进入场景

当然,要及时处理所有机器生成的数据是不可能的。然而,这正是人工智能算法(如深度学习模型)所擅长的那种任务。剩下的唯一问题是:如何在DevOps工程师的日常生活中让这些机器学习工具发挥作用?

下面是在IT部门中适合使用AIOps的一些案例:

  • 快速处理数据。可以训练一个ML模型来处理系统生成的所有类型的数据——这是未来的方向。如果必须添加新的数据类型,模型也可以相对容易地进行调整和再训练,以保持高性能。这将确保数据的完整性和保真度,从而产生全面的分析和具体的结果。
  • 深入的数据分析。当你能够实现对所有数据进行分析时,隐藏的模式就会出现,可操作的见解也会出现。然后,DevOps工程师就可以分析出基础设施需要调整的地方,以避免性能瓶颈的出现,并且可以坐在高管的桌前,为优化基础设施和改进运营提供具体的基于数据的建议。
  • 日常工作的自动化。识别出事件模式后,就可以设置自动触发器。因此,当统计数据显示某些事件总是导致特定的(负面的)结果,并且必须执行某些操作来纠正问题时,DevOps工程师就可以创建触发器并自动对此类事件做出响应。

因此,如果监控解决方案报告了由于连接数量增加而导致了CPU使用率的增加,诸如此类。Kubernetes就可以启动额外的应用程序实例,并使用负载平衡来分配访问流和减少负载。这是最简单的场景,而现实世界的用例则要复杂得多,需要允许自动执行任何的日常DevOps任务,使ML模型能够在特定条件下启动它,并预先处理问题,而不是在停机后。

使用AIOps的好处

部署AIOps解决方案可以实现以下的积极成果:

  • 不间断的产品可用性,带来积极的终端用户体验
  • 优先解决问题,而不是永久性的灭火
  • 消除数据孤岛并实现根本性的故障修复,因为您分析了业务生成的所有数据而不是使用精简样本
  • 日常任务的自动化,使您的IT部门能够集中精力于改进基础架构和流程,而不是处理重复且耗时的任务
  • 更好的协作,因为对日志的深入分析有助于显示管理决策的影响,并评估采用的业务战略的效率

与此同时,真正具有创新精神的公司已经在努力将人工智能算法、ML模型和DevOps系统相结合,以提供未来最先进的云监控和基础设施自动化解决方案。应用这些实践可以极大地改善客户体验,缩短产品的上市时间,更有效地使用基础设施,以及在团队中更好地进行协作。然而,即使是这些创新者也没有现成的解决方案来满足他们的需求,他们不得不使用Splunk、sumeoric、Datadog、promethus + Grafana、Kubernetes和terra form等流行的DevOps工具来构建这样的系统。更重要的是,尽管这个想法本身非常重要,但实施它所需的基础设施管理水平远远超过了普通公司的能力。

原文标题:What Is AIOps: The Next Level of DevOps Services,作者:Vladimir Fedak

下一代的DevOps服务:AIOps的更多相关文章

  1. 【下一代核心技术DevOps】:(五)微服务CI与Rancher持续集成

    1. 引言 DevOps的核心魅力是快速的持续集成交付,降低研发和实施运维之间的交互,使得传统的各种扯皮现象统统消失.最重要的是降低成本 保障产品交付可靠性. 使用Rancher作为持续集成的关键环节 ...

  2. [转贴]infoQ VSTS被拆成5个部分,以Azure DevOps服务形式推出

    VSTS被拆成5个部分,以Azure DevOps服务形式推出 http://www.infoq.com/cn/news/2018/09/vsts-divide5parts-azuredevops?u ...

  3. 基于云原生DevOps服务自动化部署前端项目学习总结

    本文主要以部署前端Vue项目为例,讲述了如何基于云原生DevOps服务自动化部署前端项目~从开发完成到线上环境,我们只需提交代码即可~ 一.引言 作为一名开发人员,日常工作中我们除了需要负责代码的开发 ...

  4. 【下一代核心技术DevOps】:(一)容器服务的Rancher选型

    为什么说是下一代核心技术 其实经过互联网的多次变革说起,早期的C/S架构,到后来的B/S架构,一直到现在最普遍的M/S架构,他们的背后都是技术不断的优化改进,以适应促进IT技术的发展 整体而言在过去1 ...

  5. 【下一代核心技术DevOps】:(四)私有镜像库阿里云Docker服务使用

    1.使用阿里云镜像库有很多优点 稳定可靠,阿里技术,放心使用. 国内cdn多节点加速,下载速度非常快 可以和阿里云Git代码集成,不需要第三方CI工具,当然带的自动构建服务也可以和其他的Git库集成, ...

  6. 【下一代核心技术DevOps】:(三)私有代码库阿里云Git使用

    1. 引言 使用DevOps肯定离不开和代码的集成.所以要想跑通整套流程,代码库的选型也是非常重要的.否则无法实现持续集成.目前比较常用的代码管理有SVN和GIt 如果还使用SVN的,建议尽早迁移到G ...

  7. 【下一代核心技术DevOps】:(二)Rancher的应用及优点简介

    1.环境选择 安装Rancher环境,一定要在干净的linux主机上进行,避免出现因配置导致的莫名其妙的问题.服务器操作系统建议CentOS7.4(内核3.10以上)低于这个版本的系统 如7.3 7. ...

  8. 【下一代核心技术DevOps】:(七)持续集成Jenkins的应用(Aliyun Pipiline持续构建)

    1. 前言 使用Jenkins比较好的就是可以在整个构建顺序中增加自定义的动作,比如构建成功给Leader发个邮件,给团队核心发个微信什么的. 当然最基本的核心还是它可以构建多种开发语言的项目,此类构 ...

  9. 【下一代核心技术DevOps】:(六)Rancher集中存储及相关应用

    1. 前言 为什么要使用集中存储? 使用集中存储有个很大的优势是数据安全和统一管理,和集群完美配合. 产品集成存储经历过几个阶段: 1.单机本机存储. 系统使用本地硬盘存储 2.单网络集中存储. 局域 ...

随机推荐

  1. loli的搜索测试-4

    其实这已经是第四次搜索测试了...只不过上两次测试时我不在学校,扔两个链接吧: 测试-2:https://www.luogu.org/blog/user35178/loli-di-sou-suo-ce ...

  2. Zookeeper框架Curator使用

    本文参考自https://blog.csdn.net/wo541075754/article/details/69138878?utm_source=gold_browser_extension ht ...

  3. 禁止 "启动时恢复任何注册的应用程序"

    在关闭计算机时 有些程序会进行注册 并在下次启动时恢复关闭前的状态(Restart Manager) 比如Chrome浏览器 应用程序实现这一功能可以调用RegisterApplicationRest ...

  4. empty与isset,null与undefined

    一. null VS undefined VS NaN 1. null 定义:null是特殊的object,是空对象,没有任何属性和方法. document.writeln(typeof null); ...

  5. C语言程序设计I—第一周教学

    这是在修改人才培养方案后第一次上C语言程序设计课程,本课程由原来的1学期80课时(周学时6)修改为2学期48(周学时4)+32(周学时2)课时的模式,开课学期也由一年二期改为大一整学年,当时修改的主要 ...

  6. Php5.6.31连接sqlserver 2008R2数据库问题sqlsrv(php5.3及以上版本)与mssql(php5.3以前版本)②

    Php5.6.31连接sqlserver 2008R2数据库 1.环境配置 Win7(win8.1)  64 +Apache2.4 + PHP5.6.31 + SQL Server 2008 R2数据 ...

  7. 为什么企业依赖于 NoSQL

    如果你关注大数据科技动向,你对 NoSQL 一定不陌生,NoSQL 是一个分布式数据库.在过去时间,数据存储一直关系型数据库天下,有着良好的控制并发操作.事务功能.虽然RDBMS很优秀,但是随着时间的 ...

  8. PHP中const,static,public,private,protected的区别

    原文地址:http://small.aiweimeng.top/index.php/archives/54.html const: 定义常量,一般定义后不可改变static: 静态,类名可以访问pub ...

  9. python-docx操作word文件(*.docx)

    目录 基础操作 对象关系 添加样式 中文字体微软雅黑,西文字体Times New Roman 首行缩进 单独设置标题样式 设置超链接 参考文档 基础操作 from docx import Docume ...

  10. Nodejs-第一篇(什么是NodeJS)

    NodeJS 介绍 Node.js 是什么? 1.Node.js 是一个开发平台,就像Java开发平台..Net开发平台.PHP开发平台.Apple开发平台一样: 什么是开发平台?它们有对应的编程语言 ...