火山引擎DataLeap如何解决SLA治理难题(二):申报签署流程与复盘详解
申报签署流程详解

流程简介

卡点计算

SLA推荐计算

系统保障监控
- 未到SLA:即当前时间,任务未产出,且还未到SLA时间(继续监控);
- 已达成:即任务已完成,且完成时间在所承诺的SLA之前(发送就绪通知);
- 已延迟:即任务未完成,且当前时间已在所承诺的SLA之后(发送延迟通知);
- 已延迟(产出):即任务已完成,但完成时间在所承诺的SLA之后(发送延迟产出通知);
- 从下图可以看到在任务达成、未达成两种情况下,随着时间的推移,其SLA状态的变化。

复盘管理详解
问题管理

- 不同SLA问题类型的趋势分布,针对性的治理问题
- 相同根因引发了多少SLA问题,涉及影响多少数据资产
- 哪些数据资产经常出现SLA问题,问题的分类以及是什么根因造成的
- SLA问题经验总结,方便类似问题发生后,后期做推荐辅助快速定位根因
双月
|
问题数量
|
根因种类
|
2019-07/08
|
77
|
12
|
2019-09/10
|
58
|
10
|
2019-11/12
|
33
|
7
|
2020-01/02
|
23
|
5
|
2020-03/04
|
17
|
4
|
2020-05/06
|
9
|
2
|
2020-07/08
|
9
|
2
|
事故管理

- 事故在登记时,会根据事故明细确认事故根因,并让相应负责人提出改进计划。
- 用户可以订阅事故,在事故的复盘状态及其改进计划的完成状态变化时,都会通知订阅人。
- 任务的改进计划在完成前,每日都会提醒计划负责人,直到计划完成为止
- 对事故的复盘归档管理,方便后期随时查阅,定位相关SLA信息
- 针对不同数据团队发生SLA事故的整体情况进行对比查看,互相借鉴
- 对事故的改进计划管理跟踪,验收SLA的治理效果
双月
|
事故数量
|
环比
|
2019-07/08
|
46
|
- - -
|
2019-09/10
|
26
|
-43%
|
2019-11/12
|
18
|
-31%
|
2020-01/02
|
13
|
-28%
|
2020-03/04
|
7
|
-46%
|
2020-05/06
|
6
|
-14%
|
2020-07/08
|
5
|
-16%
|
了解更多
火山引擎DataLeap如何解决SLA治理难题(二):申报签署流程与复盘详解的更多相关文章
- 难对齐、难保障、难管理?一文了解字节跳动如何解决数据SLA治理难题
基于字节跳动分布式治理的理念,数据平台数据治理团队自研了SLA保障平台,目前已在字节内部得到广泛使用,并支持了绝大部分数据团队的SLA治理需求,每天保障的SLA链路数量过千,解决了数据SLA难对齐.难 ...
- 火山引擎 DataLeap:3 个关键步骤,复制字节跳动一站式数据治理经验
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,并进入官方交流群 DataLeap 是火山引擎数智平台 VeDI 旗下的大数据研发治理套件产品,帮助用户快速完成数据集成.开发.运维.治理. ...
- 如何又快又好实现 Catalog 系统搜索能力?火山引擎 DataLeap 这样做
摘要 DataLeap 是火山引擎数智平台 VeDI 旗下的大数据研发治理套件产品,帮助用户快速完成数据集成.开发.运维.治理.资产.安全等全套数据中台建设,降低工作成本和数据维护成本.挖掘数据价 ...
- 火山引擎 DataLeap:揭秘字节跳动数据血缘架构演进之路
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 DataLeap 是火山引擎数智平台 VeDI 旗下的大数据研发治理套件产品,帮助用户快速完成数据集成.开发.运维 ...
- 火山引擎 DataLeap:一家企业,数据体系要怎么搭建?
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 导读:经过十多年的发展,数据治理在传统行业以及新兴互联网公司都已经产生落地实践.字节跳动也在探索一种分布式的数据治 ...
- 火山引擎 DataLeap 的 Data Catalog 系统公有云实践
Data Catalog 通过汇总技术和业务元数据,解决大数据生产者组织梳理数据.数据消费者找数和理解数的业务场景.本篇内容源自于火山引擎大数据研发治理套件 DataLeap 中的 Data Ca ...
- 火山引擎DataLeap数据调度实例的 DAG 优化方案
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,并进入官方交流群 实例 DAG 介绍 DataLeap 是火山引擎自研的一站式大数据中台解决方案,集数据集成.开发.运维.治理.资产管理能力 ...
- 系统丢失的DLL文件问题根源解决(纯净官网下载放心)(图文详解)(博主推荐)
导言 最近,身边的朋友们,问我,他电脑的win10系统里 mfc110.dll 丢失. 其他的系统文件丢失修复,是一样的步骤. 现象 大家也许,都会有这么一个习惯,动不动则就去百度上搜索. 其实啊,这 ...
- zepto的touch模块解决click延迟300ms问题以及点透问题的详解
大家都知道移动端的click事件会延迟300ms触发,这时大家可以使用zepto的touch模块,里面定义了一个tap事件,通过绑定tap事件,可以实现点击立即触发的功能. 那么,它的tap事件是怎么 ...
- 火山引擎MARS-APM Plus x 飞书 |降低线上OOM,提高App性能稳定性
通过使用火山引擎MARS-APM Plus的memory graph功能,飞书研发团队有效分析定位问题线上case多达30例,线上OOM率降低到了0.8‰,降幅达到60%.大幅提升了用户体验,为飞书的 ...
随机推荐
- k8s zookeeper安装(集群版与非集群版)
集群版zookeeper安装 第一步:添加helm镜像源 helm repo add incubator http://storage.googleapis.com/kubernetes-charts ...
- webview是什么?作用是什么?和浏览器有什么关系?
Webview 是一个基于webkit的引擎,可以解析DOM 元素,展示html页面的控件,它和浏览器展示页面的原理是相同的,所以可以把它当做浏览器看待.(chrome浏览器也是基于webkit引擎开 ...
- 基于iptables防火墙堵漏
之前在网上流传个段子:发现自己电脑被入侵,最有效的办法是即拔掉网线~ 虽然只是个段子却说明一旦机器发现漏洞被入侵,阻断入侵刻不容缓,无论对个人电脑和业务服务器都是如此. 商业服务器虽然有各种防护措施, ...
- CSS必学:元素之间的空白与行内块的幽灵空白问题
作者:WangMin 格言:努力做好自己喜欢的每一件事 CSDN原创文章 博客地址 WangMin 我们在开发的过程中,难免会出现一些难以预料的问题.那么其中,CSS空白现象就是非常常见的问题之一.虽 ...
- 【Unity】 ScriptableObject ——生成多个ScriptableObject作为子对象,可以点击展开并显示二级菜单
官方是这么介绍ScriptabelObject的: "ScriptableObject 是一个可独立于类实例来保存大量数据的数据容器.ScriptableObject 的一个主要用例是通过避 ...
- 重学Java(一):什么是对象
前言 本系列文章内容来自于<Thinking in Java>作者的最新续作<On Java>基础卷,作者根据最新 Java 8.11.17的内容,重讲了Java的编程思想,值 ...
- Python将一个正整数分解质因数。例如:输入90,打印出90=2*3*3*5。
def SlowSnail(n): while n != 1: # 循环保证递归 for index in range(2, n + 1): if n % index == 0: n //= inde ...
- FC 交换机基础配置
目录 Primera600 存储服务器 FC 交换机 交换机信息查看 交换机配置管理 用户管理 以太网配置 端口配置管理 别名配置 证书管理 角色管理 Zone 管理 参考网址 Primera600 ...
- 解密Prompt系列20. LLM Agent之再谈RAG的召回多样性优化
几个月前我们就聊过RAG的经典方案解密Prompt系列14. LLM Agent之搜索应用设计.前几天刚看完openAI在DevDay闭门会议上介绍的RAG相关的经验,有些新的感悟,借此机会再梳理下R ...
- gridlayout
<?xml version="1.0" encoding="utf-8"?> <GridLayout xmlns:android=" ...