版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。

【摘要】 本文简要介绍AIOps系统主要组成部分,介绍该系统在企业级IT运维场景下的作用和地位。

我们已经成功地应用了人工智能和机器学习来自动化传统的人工任务和IT操作过程。从异常检测到自动修复,现在将前沿算法融入到易于使用的工具中,允许组织通过从时间消耗和容易出错的过程中解放人力简化操作。

运维人员可能需要几个小时才能完成的事情,基于AIOps只需几秒钟就能完成,而且精度更高。这正被世界500强企业所认可,这些企业正在迅速采用这些技术,以及Gartner等领先的分析师公司,这些公司越来越关注这个问题。在过去几年中,为了应对数字化转型给企业带来的日益增加的系统复杂性,市场上也出现了很多AIOps或者ITOA的产品。

1 AIOps VS ITOA

正如Flercher所解释的那样,AIOps本质上是技术的演进,这些技术以前被归类为IT运营分析。虽然AIOps与ITOA非常相关,但它代表了一组相当广泛的功能,主要集中于分析IT操作数据,包括监控、日志分析、安全等。ITOA领域的供应商包含来自CA、EMC、Solarwinds和Zenoss等厂商,但他们在其核心ITOA产品中没有这种原生的机器学习能力,因此这些厂商并不算是AIOps。

AIOps平台接收从不同数据源发送过来的IT日志数据,并应用各种形式的算法。通过使用AIOps平台,IT组织可以实现运维自动化并提升运维实践,并对其业务服务的性能进行持续的洞察。

2 AIOps是否重要?

在这篇论文中, “Applying AIOps to Broader Datasets Will Create Unique Business Insights” Gartner报告说,2015年全球AIOps支出超过$ 17亿。此外,到2020年,大约50%的企业将积极使用AIOps平台来提供对业务执行和IT运营的洞察,而今天还不足10%。

随着企业在数字化转型的过程中经历了巨大的变化和扩张,企业将被迫在加大运营人数或采用AIOps平台之间做出选择。

3 AIOps平台关键部件

Gartner在论文中描述了AIOps平台的逻辑架构 “Innovation Insight for Algorithmic IT Operations”,这里我们使用一个简化的版本以理解AIOps平台的不同部分如何适合您更广泛的IT运营需求。

从众多大公司的IT运维实践中可以看到,一个企业级IT运营工具链的关键部件包括:监控生态系统、一个智能检测系统、一个工单与知识管理系统、一个自动化系统和一个数据湖。

监控生态系统,提供可视化和创建跨物理和虚拟堆栈的日志收集能力。这些工具包括AppDynamicSolarwinds。一个好的日志收集平台对于提升运维服务质量非常重要,但是过度负责的日志收集系统有时也会带来大量的数据噪声影响IT团队的工作效率。

数据智能检测系统,降低数据噪音,实时将分析结果推送给相关运维人员。这是运营团队在响应运维事件时的第一选项。事实上,运用智能检测系统能够让你在第一时间知道系统内发生了哪些预料之外的问题,并且在最短时间内告诉你如何消除影响,通过应用机器学习和实时计算,智能检测系统可以做到早发现早响应,比如Moogsoft AIOps

工单与知识库实现用户对IT需求的交互式响应,以及IT服务的文档化管理,通常我们用工单管理所有的问题单,并且会绑定资产库和服务目录以及案例库,从而实现知识积累和能力的不断提升。之类系统包括诸如ServiceNow和Jira。

自动化系统可以根据具体事件自动应用脚本,以便减少繁重的重复性的劳动。常见的动作包括编排、运行库自动化和IT自动化。自动化系统包括ansible和Puppet等工具。

最后,数据湖用于故障诊断、ad-hoc查询以及监控仪表盘。数据湖应包含所有与IT系统相关的数据和日志,数据湖对进行更深入的分析至关重要。数据湖工具包括Splunk版本和ELK。

4 AIOps平台是IT运营的下一代解决方案

IT平台的复杂度和集成度将继续以指数级增长,而人的能力相对保持不变,从而变成制约业务发展的内在原因,而AIOps可以真正提升运维效率,提升洞察力,让运维人员关注真正需要关注的事情-用户满意度

来源:华为云社区 作者:菊花茶

AIOps产品与架构浅析【华为云技术分享】的更多相关文章

  1. 性能达到原生 MySQL 七倍,华为云 Taurus 技术解读【华为云技术分享】

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...

  2. 【华为云实战开发】9.如何进行PHP项目的快速搭建并实现CICD?【华为云技术分享】

    1 概述 1.1 文章目的 本文主要想为研发PHP项目的企业或个人提供上云指导,通过本文中的示例项目 “workerman-todpole”,为开发者提供包括项目管理,代码托管,代码检查,编译构建,测 ...

  3. DevOps on DevCloud|如何采用流水线践行CI/CD理念【华为云技术分享】

    [摘要] 持续集成/持续交付(CI/CD,Continuous Integration/Continuous Deployment)在DevOps CMALS理念中具有支柱性地位,因而CI/CD流水线 ...

  4. 揭秘丨7分钟看懂华为云鲲鹏Redis背后的自研技术【华为云技术分享】

    2019年5月,华为云发布全球首个基于自研ARM架构的分布式缓存鲲鹏Redis,搭载华为LibOS+华为编译器+安全容器引擎三项黑科技,在保证Redis强劲高性能外,还降低客户30%的使用成本,真正实 ...

  5. 【华为敏捷/DevOps实践】7. 敏捷,DevOps,傻傻不分清楚【华为云技术分享】

    文:姚冬(华为云DevCloud首席技术布道师,资深DevOps与精益/敏捷专家,金融解决方案技术Leader,中国DevOpsDays社区核心组织者) 前言 敏捷是什么?DevOps是什么?两者有什 ...

  6. 重磅!普惠AI--华为云语音语义万次调用1元购,有奖问答@评论区等你来!【华为云技术分享】

    活动快速入口:https://activity.huaweicloud.com/language_speech_promotion0.html 语音交互与自然语言处理 语音交互是一种人机交互方式,以开 ...

  7. MySQL 8.0新增特性详解【华为云技术分享】

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...

  8. 不服跑个分:ARM鲲鹏云服务器实战评测——华为云鲲鹏KC1实例 vs. 阿里云G5实例【华为云技术分享】

    原文链接:https://m.ithome.com/html/444828.htm 今年一月份,华为正式发布了鲲鹏920数据中心高性能处理器,该处理器兼容ARM架构,采用7纳米制造,最高支持64核,主 ...

  9. 【华为云实战开发】8.如何快速搭建C#网站并实现持续集成?【华为云技术分享】

    1 概述 1.1 文章目的 本文通过一个实例介绍如何使用软件开发服务DevCloud完成一个C#Web项目的开发. 1.2 项目详情 1. 项目名称:超级冷笑话网站 2. 项目简介:一个Web网站,包 ...

随机推荐

  1. Apache配置反向代理、负载均衡和集群(mod_proxy方式)

    Apache配置负载均衡和集群使用mod_jk的方式比较多,但是mod_jk已经停止更新,并且配置相对复杂.Apache2.2以后,提供了一种原生的方式配置负载均衡和集群,比mod_jk简单很多. 1 ...

  2. 域名解析 | A记录 ,CNAME,MX,NS 你懂了吗

    域名解析 | A记录 ,CNAME,MX,NS 你懂了吗 域名解析 什么是域名解析?域名解析就是国际域名或者国内域名以及中文域名等域名申请后做的到IP地址的转换过程.IP地址是网路上标识您站点的数字地 ...

  3. 46 Linden Street ACT II

    46 Linden Street ACT II Excuse me , officer. Can you help me? Sure. Can you tell me, How to get to L ...

  4. php+mysql 实现无限极分类

    php+mysql 实现无限极分类<pre>id name pid path 1 电脑 0 0 2 手机 0 0 3 笔记本 1 0-1 4 超级本 3 0-1-3 5 游戏本 3 0-1 ...

  5. PHP更新用户微信信息的方法

    PHP更新用户微信信息的方法 大家都知道 授权登录一次 获取后 再登录就会提示已经授权登录 就没办法重新获得用户信息了 这个时候根据openid来获取了请求user/info这个获取ps:必须关注过公 ...

  6. centos6的JDK安装

    1. 通过如下命令查看当前操作系统是否存在JDK rpm -qa | grep java 如果出现以下内容说明你的操作系统存在jdk 2.那么依次通过如下命令进行删除它 rpm -e - -nodep ...

  7. Non-local Neural Networks 原理详解及自注意力机制思考

    Paper:https://arxiv.org/abs/1711.07971v1 Author:Xiaolong Wang, Ross Girshick, Abhinav Gupta, Kaiming ...

  8. Git III: 撤销操作

    所谓撤销操作,无非就是后悔药.对Git来说,撤销操作主要是以下几块: 撤销已经提交的Commit. 对已经通过git add加入Stage的文件,进行unstage操作. 对已经是Untracked却 ...

  9. mysql 不需要使用密码就可以登录

    最近发现一个问题, 就是我等了mysql客户端可以不输入密码. 直接输入mysql -u root 回车 或者 输入一个错的密码,都可进入到下面的界面. 在Navicat不用输入密码, 或者数据错的密 ...

  10. RGW Data Layout

    目录 Overview metadata bucket index data RGW Pools RGW Object References Overview RGW 中三个基本概念:user, bu ...