图解 Apache SkyWalking UI 的使用
Apache SkyWalking的UI界面主要分为以下几个区域:
- 功能选择区:这里列出了主要的UI功能,包括仪表盘、拓扑图、追踪、性能刨析、告警等功能
- 重新加载区:控制重新加载机制,包括定期重新加载或手动重新加载。
- 时间选择器:控制时区和时间范围。这里有一个中文/英文切换按钮,默认,UI使用浏览器语言设置。
下面逐一介绍功能选择区的各个功能。
文章持续更新,微信搜索「万猫学社」第一时间阅读,关注后回复「电子书」,免费获取12本Java必读技术书籍。
仪表盘
仪表盘又分为以下几个功能:
- APM:以全局(Global)、服务(Service)、服务实例(Instance)、端点(Endpoint)的维度展示各项指标。
- Database:展示数据库的各项指标。
- SelfObservability:展示OAP服务端的各项指标。
- Web Browser:以服务和页面的维度展示Web浏览器端的各项指标。
相关概念解释:
- 服务(Service):表示对请求提供相同行为的一组工作负载,比如:一个的 Web API系统。
- 服务实例(Instance):上述的一组工作负载中的每一个工作负载称为一个实例,比如:一个的 Web API 系统集群中的一个实例。
- 端点(Endpoint):对于特定服务所接收的请求路径,如 HTTP 的 URI 路径和 gRPC 服务的类名 + 方法签名。
APM - 全局(Global)
全局(Global)展示的是所有服务的各项指标,包括:
- 吞吐量排名,单位为CPM(calls per minute,每分钟的调用次数)。
- 服务响应时间排名,单位为毫秒。
- 不健康服务排名,单位为Apdex(Application Performance Index,应用性能指数)。
- 端点响应时间排名,单位为毫秒。
- 响应时间百分位,包括
p99
,p95
,p90
,p75
,p50
,单位为毫秒。 - 响应时间热力图,单位为毫秒。
相关概念解释:
- Apdex:Application Performance Index,应用性能指数, Apdex = (满意样本数 + 可容忍样本数 * 0.5) / 样本总数,满意样本为响应时间小等于
Apdex阈值
,可容忍样本为响应时间大于Apdex阈值
并小等于4倍的Apdex阈值
。目前Apdex阈值
为0.5秒。
APM - 服务(Service)
服务(Service)是以服务的维度展示各项指标,包括:
- 服务Apdex(Application Performance Index,应用性能指数)。
- 服务平均响应时间,单位为毫秒。
- 服务成功率。
- 服务吞吐量,单位为CPM(calls per minute,每分钟的调用次数)。
- 服务Apdex曲线图。
- 服务百分位,包括
p99
,p95
,p90
,p75
,p50
,单位为毫秒。 - 服务成功率曲线图。
- 服务吞吐量曲线图,单位为CPM(calls per minute,每分钟的调用次数)。
- 端点吞吐量排名,单位为CPM(calls per minute,每分钟的调用次数)。
- 端点响应时间排名,单位为毫秒。
- 端点成功率排名。
APM - 服务实例(Instance)
服务实例(Instance)是以实例的维度展示各项指标,包括:
- 实例吞吐量,单位为CPM(calls per minute,每分钟的调用次数)。
- 实例成功率。
- 实例平均响应时间,单位为毫秒。
- JVM的CPU使用百分比。
- JVM的内存使用情况。
- JVM的GC时间。
- JVM的GC次数。
APM - 端点(Endpoint)
端点(Endpoint)是以端点的维度展示各项指标,包括:
- 端点吞吐量排名,单位为CPM(calls per minute,每分钟的调用次数)。
- 端点平均响应时间排名,单位为毫秒。
- 端点成功率排名。
- 端点吞吐量曲线图,单位为CPM(calls per minute,每分钟的调用次数)。
- 端点平均响应时间曲线图,单位为毫秒。
- 端点百分位,包括
p99
,p95
,p90
,p75
,p50
,单位为毫秒。 - 端点成功率曲线图。
文章持续更新,微信搜索「万猫学社」第一时间阅读,关注后回复「电子书」,免费获取12本Java必读技术书籍。
Database
展示数据库(Database)相关的各项指标,包括:
- 数据库平均响应时间,单位为毫秒。
- 数据库访问成功率。
- 数据库吞吐量,单位为CPM(calls per minute,每分钟的调用次数)。
- 数据库访问百分位,包括
p99
,p95
,p90
,p75
,p50
,单位为毫秒。 - 慢查询列表,单位为毫秒。
- 所有数据库吞吐量排名,单位为CPM(calls per minute,每分钟的调用次数)。
- 所有数据库成功率排名。
拓扑图
拓扑图可以显示服务之间的拓扑关系,如下图:
- 服务选择器,可以选择某个服务,显示其直接关系,包括上游和下游。
- 自定义组,可以创建自定义的任意一组服务,用于显示其一组服务的拓扑图。
点击某些服务的图标,可查看该服务的类型、Apdex、成功率、响应时间、吞吐量、百分位等信息,如下图:
点击服务之间的连线,可查看两个服务之间的响应时间、吞吐量、成功率、百分位等信息,如下图:
点击上图中的展示实例依赖按钮,可查看各个实例之间的响应时间、吞吐量、成功率、百分位等信息,如下图:
追踪
追踪页面可以查询到某个分布式链路的整体情况,如下图:
- 搜索条件设置,支持按服务、实例、端点名称、追踪ID、时间范围等条件进行查询。
- 片段(Segment)列表,点击某个片段(Segment),在右侧展示与片段(Segment)相关的整个追踪(Trace)。
- 服务列表,是这个追踪(Trace)涉及的所有服务,每个服务用不同的颜色展示。
- 跨度(Span)列表,是这个追踪(Trace)涉及的所有跨度(Span),还可以看到每个跨度(Span)耗时和层级关系。点击某个跨度(Span),可以看到它的等服务名称、端点名称信息。
- 追踪(Trace)视图设置,提供3种视图展示追踪(Trace):列表、树结构、表格。
相关概念解释:
- 追踪(Trace):一个追踪(Trace)表示一个事务或者流程在分布式系统中的执行过程,是一条完整的分布式调用链。
- 跨度(Span):一个跨度(Span)表示系统中具有开始时间和执行时长的逻辑运行单元。跨度(Span)之间通过嵌套或者顺序排列建立逻辑因果关系,最终形成一个追踪(Trace)。
- 片段(Segment):一个片段(Segment)表示同一端点内的一组跨度(Span)的集合。
常见的错误可能是由代码异常或网络故障引起的,通过追踪(Trace)视图提供的跨度(Span)细节,可以快速找到错误发生在哪个环节。
性能刨析
性能剖析是利用方法栈快照,并对方法执行情况进行分析和汇总,对代码执行速度进行估算。
性能剖析激活时,会对指定线程周期性的进行线程栈快照,并将所有的快照进行汇总分析,如果两个连续的快照含有同样的方法栈,则说明此栈中的方法大概率在这个时间间隔内都处于执行状态。从而,通过这种连续快照的时间间隔累加成为估算的方法执行时间。
文章持续更新,微信搜索「万猫学社」第一时间阅读,关注后回复「电子书」,免费获取12本Java必读技术书籍。
创建任务
想要进行性能刨析,我们必须创建一个任务,如下图:
- 选择指定的服务。
- 输入端点名称,这里的端点名称通常是第一个片段(Segment)的操作名,在追踪页面的追踪(Trace)视图里可以找到。
- 选择监控时间,可以从现在开始,也可以从未来的任何时间开始。
- 选择监视持续时间,可以设置监视的时间窗口,以查找到合适的请求进行性能刨析。
- 监控间隔,提供了一个过滤器机制,如果给定端点响应的请求很快,它就不会性能刨析,可以确保性能刨析的数据是预期的数据。
- 最大采样数,表示探针收集的最大数据集,它有助于减少内存和网络负载。
即使性能刨析对目标系统的性能影响非常有限,但它仍然是一个额外的负载,以上设置可以使性能影响可控。另外,在任何时刻,每个服务只能执行一个性能刨析任务。
分析结果
等待性能刨析的任务完成后,对应的片段(Segment)就会在右侧展示出来。点击某个片段(Segment),可以更详细地看到各个片段(Segment)的耗时,如下图:
从上图可以看到最慢的片段(Segment)。点击分析按钮,可以看到基于方法栈的分析结果,包括对应的类名、方法名、代码行数、耗时等信息,最慢的方法栈被高亮显示,如下图:
性能剖析的优势
- 精确的问题定位,直接找到代码方法和代码行;
- 无需反复的增删埋点,大大减少了人力开发成本;
- 不用承担过多埋点对目标系统和监控系统的压力和性能风险;
- 按需使用,平时对系统无消耗,使用时的消耗稳定可控。
告警
在告警页面可以查看所有触发的告警,如下图:
过滤范围的设置包括:服务、服务实例、端点、服务关系、服务实例关系、端点关系等。
微信公众号:万猫学社
微信扫描二维码
关注后回复「电子书」
获取12本Java必读技术书籍
图解 Apache SkyWalking UI 的使用的更多相关文章
- Apache SkyWalking的架构设计【译文】
Apache SkyWalking提供了一个功能强大并且很轻量级的后端.在此,将介绍为什么采用以下方式来设计它,以及它又是如何工作的. 架构图 对于APM而言,agent或SDKs仅是如何使用libs ...
- Apache SkyWalking
Apache SkyWalking 什么是 SkyWalking SkyWalking 是观察性分析平台和应用性能管理系统. 提供分布式追踪.服务网格遥测分析.度量聚合和可视化一体化解决方案. 支持J ...
- Apache SkyWalking 为.NET Core带来开箱即用的分布式追踪和应用性能监控
在大型网站系统设计中,随着分布式架构,特别是微服务架构的流行,我们将系统解耦成更小的单元,通过不断的添加新的.小的模块或者重用已经有的模块来构建复杂的系统.随着模块的不断增多,一次请求可能会涉及到十几 ...
- Apache SkyWalking 告警配置指南
Apache SkyWalking Apache SkyWalking是分布式系统的应用程序性能监视工具(Application Performance Management,APM),专为微服务.云 ...
- 安装-apache skywalking (java 应用性能监控)
官网:http://skywalking.apache.org/ 服务器:10.30.31.28 centos 7 jdk 1.8.x ES 5.x 5.0.0-bet a2版本 . http://s ...
- 图解Apache Mina
Apache MINA 是一个用于简化开发构建高性能.高可扩展的网络应用框架.通过JAVA NIO在各种传输协议(如:TCP/IP.UDP/IP)上提供抽象的事件驱动异步API Apache MINA ...
- 一篇文章快速搞懂 Apache SkyWalking 的 OAL
OAL简介 在流模式(Streaming mode)下,SkyWalking 提供了 观测分析语言(Observability Analysis Language,OAL) 来分析流入的数据. OAL ...
- 详解 Apache SkyWalking 跨进程传播协议
简介 SkyWalking 跨进程传播协议是用于上下文的传播,本文介绍的版本是3.0,也被称为为sw8协议. Header项 Header应该是上下文传播的最低要求. Header名称:sw8. He ...
- 速查列表:Apache SkyWalking OAL 的 域(Scopes)
OAL简介 在流模式(Streaming mode)下,SkyWalking 提供了 观测分析语言(Observability Analysis Language,OAL) 来分析流入的数据. OAL ...
随机推荐
- java中的排序除了冒泡以来, 再给出一种方法, 举例说明
9.5 排序: 有一种排序的方法,非常好理解,详见本题的步骤,先找出最大值和最小值,把最小值打印出来后,把它存在另一个数组b当中,再删除此最小值,之后再来一次找出最小值,打印出最小值以后,再把它存 ...
- java中方法重载是什么, 实际中到底有什么意义, 用处?请举例
7.3 方法重载(overload) 当几个方法有相同的方法名,但参数个数不同或参数类型不同时,就涉及方法重载 方法重载有什么意义呢?在公司里编程,有时候一个方法名,要用到很多次,而且每次跟每次的参 ...
- 将百度地图Demo抽取出来安到自己的程序中
今日所学: 使用百度地图ADK实现手机定位 [Android]使用百度.高德.腾讯地图SDK获取定位数据与屏幕截图分享到QQ_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili 代码获取SHA1 (2 ...
- js判断json数据是否存在某字段的方法
方式一 !("key" in obj) if("name" in json){//json就是数组,name是你要找的值 console.log("有 ...
- 动态div点击事件传递对象参数格式-草稿889
<button type='button' style='border: 1px solid #eeeeee;color: #717070;height: 20px;border-radius: ...
- MyBatis 及 MyBatis Plus 纯注解方式配置(Spring Boot + Postgresql)
说明 当前的版本为 MyBatis 3.5.9 MyBatis Plus 3.5.1 Spring Boot 2.6.4 Postgresql 42.3.3 与 Spring Boot 结合使用 My ...
- mybatis plus @TableId注解 type属性的含义
首先该注解用在主键id上,它的type属性有8种类型 AUTO(0),NONE(1),INPUT(2),ASSIGN_ID(3),ASSIGN_UUID(4),ID_WORKER(3),ID_WORK ...
- Linux内核--链表结构(一)
一.前言 Linux内核链表结构是一种双向循环链表结构,与传统的链表结构不同,Linux内核链表结构仅包含前驱和后继指针,不包含数据域.使用链表结构,仅需在结构体成员中包含list_head*成员就行 ...
- 超酷!!HTML5 Canvas 水流样式 Loading 动画
今天我们要分享另外一款基于HTML5 Canvas的液体流动样式Loading加载动画,这款Loading动画在加载时会呈现液体流动的动画效果,并且由于和背景颜色的对比,也略微呈现发光的动画效果. 效 ...
- 使用GO语言通过Stream Load实现Doris数据导入
Doris github地址欢迎加Star apache/incubator-doris: Apache Doris(Incubating) is an MPP-based interactive S ...