nCompass-解决方案介绍

1.  IT运维的现状及痛点

业务部门投诉系统不可用,各个部门盘查: 网络是通的;系统资源正常;应用进程状态都是正常的;数据库日志中也没有报错

  • 运维被动: 80%的故障都是用户先发现反馈给服务台后,运维人员才知道
  • 架构复杂:系统架构变得越来越复杂,问题多,责任界定及排障困难。
  • 说不清:系统不可用,各部门,服务商都说不是自己的问题。
  • 价值难以体现:不出故障觉得运维没用,出了故障觉得运维更没用

2.  运维的发展历程

3.  智能架构(Dev Ops 及 AI Ops对平台要求较高)

  • 数据接入(流量、日志、三方数据)-----多源数据统一接入、关联分析、统一呈现
  • 多源数据整合(1000W/S处理能力)-----1000万/秒的高速处理效率
  • 规则库-----可编辑的分析规则,可针对不同类型的数据进行统计分析
  • 机器学习/算法(智能基线/警报 、隐患排查/预警、智能分析/定位、  评估报告/建议)----- AI算法的支持,异常检测,多维主因素分析,预测分析,根因定位
  • 动态大屏/场景模块------可灵活编辑的前端动态Dashboard,基于用户架构快速实现数据可视化
  • 平台协调------可给予脚本实现多平台的行为联动,AIOps落地

4. 业务可视化平台搭建的5个步骤

  • 业务梳理:真正了解你的业务系统状态(业务之间调用关系,网络节点/应用节点,端到端监控展示形式)
  • 业务可视:全方位、多维度的进行业务可视化(针对网络的,针对系统的,互联网出口,专线链路,端口流量,可用性等),nCompass通过内置可视化70多种显示控件。
                       a. 可视化,看得见,才能管理
                       b. 运维价值体现
                       c. 重大事件保障(促销监控保障)
  • 智能监控:建立基于机器学习算法的主动式监控体系(解决经常误报,经常少报,不够灵活,不够全面,不够预测)
                       a. 基于机器学习技术,可实现指标的告警基线自动生成,当指标明显偏离正常运行区间时,可主动发出告警;
                       b. 基于异常检测技术,对告警事件进行精细化处理,规避误报、漏报的现象。
  • 知识图谱:基于AI算法驱动的数据智能分析, 内置智能根因定位的主要算法:
                       a. 基线偏离算法:基于指标的历史数据,预测未来数据的区间(上基线,下基线)用于智能告警场景。
                       b. 异常检测:检测数据序列中的离群点,用于异常检测/告警场景。使用非监督学习/监督学习结合的算法综合判断异常情况,内置行业海量数据的预测训练模式;
                       c. 根因定位算法:使用NEO4J构建分析对象关系图,提取待分析节点的相关节点机路径,结合知识库进行相关性分析,综合推导异常根因。用于告警或事件分析场景。
                       d. 多维主因素算法:深度分析数据变化的维度组成情况,并给出变化贡献度评分,用于变化或问题的主要因素定位。
                       e. 预测算法:基于历史数据预测未来的数据走势,反映出数据的周期性、趋势、波动等特性。用于容量规划、异常预测等场景。根据具体场景的的准确性及性能要求,选择使用LSYM或ARIMA实现算法。
                 异常时会收到告警邮件,会通知您“告警对象”“告警内同”“智能分析”“分析建议”“分析报告等”。
                 nCompass内置的知识图谱或称故障场景有, 业务突发/ 性能下降/ 可用性异常/变更比对分析/业务路径自动梳理/隐患排查。 也可自定义场景。
                 实时监控  →  基线告警  →  智能分析  →  根因定位  →  报告推送
  • 平台联动:多平台的联动从而实现故障自愈

5. nCompass与传统网络监控分析方法对比

nCompass-解决方案介绍的更多相关文章

  1. 著名ERP厂商的SSO单点登录解决方案介绍一

          SSO英文全称Single Sign On,单点登录.SSO是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统.它包括可以将这次主要的登录映射到其他应用中用于同一个用户 ...

  2. #研发解决方案介绍#Tracing(鹰眼)

    郑昀 最后更新于2014/11/12 关键词:GoogleDapper.分布式跟踪.鹰眼.Tracing.HBase.HDFS. 本文档适用人员:研发   分布式系统为什么需要 Tracing?   ...

  3. #研发解决方案介绍#IdCenter(内部统一认证系统)

    郑昀 基于朱传志的设计文档 最后更新于2014/11/13 关键词:LDAP.认证.权限分配.IdCenter. 本文档适用人员:研发   曾经一个IT内部系统配一套帐号体系和授权   线上生产环境里 ...

  4. #研发解决方案介绍#基于StatsD+Graphite的智能监控解决方案

    郑昀 基于李丹和刘奎的文档 创建于2014/12/5 关键词:监控.dashboard.PHP.graphite.statsd.whisper.carbon.grafana.influxdb.Pyth ...

  5. #研发解决方案介绍#基于ES的搜索+筛选+排序解决方案

    郑昀 基于胡耀华和王超的设计文档 最后更新于2014/12/3 关键词:ElasticSearch.Lucene.solr.搜索.facet.高可用.可伸缩.mongodb.SearchHub.商品中 ...

  6. #研发解决方案介绍#Recsys-Evaluate(推荐评测)

    郑昀 基于刘金鑫文档 最后更新于2014/12/1 关键词:recsys.推荐评测.Evaluation of Recommender System.piwik.flume.kafka.storm.r ...

  7. CAS Client集群环境的Session问题及解决方案介绍,下篇介绍作者本人项目中的解决方案代码

    CAS Client集群环境的Session问题及解决方案  程序猿讲故事  2016-05-20  原文 [原创申明:文章为原创,欢迎非盈利性转载,但转载必须注明来源] 之前写过一篇文章,介绍单点登 ...

  8. abp(net core)+easyui+efcore仓储系统——解决方案介绍(二)

    abp(net core)+easyui+efcore仓储系统目录 abp(net core)+easyui+efcore仓储系统——ABP总体介绍(一) ABP框架 首先介绍一下abp框架,abp其 ...

  9. 单点登录(SSO)解决方案介绍

    一.单点登录的介绍 单点登录(Single Sign On),简称为 SSO,是目前比较流行的企业业务整合的解决方案之一.SSO的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用 ...

  10. OSSCore 开源解决方案介绍

    基于.NetCore的积木化服务框架,主要将常规解决方案进行进一步的抽象下沉形成相关基础可选框架单元(在Framework 目录),并在此基础上实现常规系统模块(在Modules 目录),如用户管理, ...

随机推荐

  1. innobackupex 恢复脚本

    此脚本需要与我前几天写的备份脚本配套才能使用 这里也对innobackupex吐槽下,当使用innobackupex进行恢复的时候,必须要清除所有原数据文件,但是一旦恢复失败,则连实例都将丢失,不成功 ...

  2. Django面试集锦(51-65)

    目录 51.Django中filter和exclude的区别? 52.Django中values和values_list的区别? 53.如何使用django orm批量创建数据? 54.Django的 ...

  3. webpack chunkFilename 非入口文件的命名规则 [转]

    官网的文档只理解了filename是主入口的文件名,chunkFilename是非主入口的文件名 filename应该比较好理解,就是对应于entry里面生成出来的文件名.比如: { entry: { ...

  4. 上周 GitHub 热点速览 vol.07:GitHub 官方 CLI beta 版已发布

    摘要:GitHub Trending 上周看点,GitHub 官宣 CLI 已发布 beta 版,前端新晋高性能打包神器 esbuild 宣战 Webpack&Parcel,微软.Facebo ...

  5. c++ 初始化列表和构造函数初始化区别

    先上代码 #include <iostream> class MyContruct { public: MyContruct() { std::cout << "My ...

  6. Spring Boot从入门到精通(二)配置GitHub并上传Maven项目

    简单介绍一下GitHub,它是一个面向开源及私有软件项目的托管平台,因为只支持git作为唯一的版本库格式进行托管,故名GitHub. GitHub于2008年4月10日正式上线,除了Git代码仓库托管 ...

  7. MySQL8.0 InnoDB并行执行

    概述 MySQL经过多年的发展已然成为最流行的数据库,广泛用于互联网行业,并逐步向各个传统行业渗透.之所以流行,一方面是其优秀的高并发事务处理的能力,另一方面也得益于MySQL丰富的生态.MySQL在 ...

  8. 推荐算法之因子分解机(FM)

    在这篇文章我们将介绍因式分解机模型(FM),为行文方便后文均以FM表示.FM模型结合了支持向量机与因子分解模型的优点,并且能够用了回归.二分类以及排序任务,速度快,是推荐算法中召回与排序的利器.FM算 ...

  9. Zookeeper 介绍 原理

    简介: ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务.       它Google的Chubby一个开源的实现,在分布式协调技术方面做得比较好的就是Google的Chubby还有 ...

  10. C#设计模式学习笔记:(12)代理模式

    本笔记摘抄自:https://www.cnblogs.com/PatrickLiu/p/7814004.html,记录一下学习过程以备后续查用. 一.引言 今天我们要讲结构型设计模式的第七个模式,也是 ...