在 SkyWalking 中,TraceSegment 是一个介于 Trace 与 Span 之间的概念,它是一条 Trace 的一段,可以包含多个 Span。在微服务架构中,一个请求基本都会涉及跨进程(以及跨线程)的操作,例如, RPC 调用、通过 MQ 异步执行、HTTP 请求远端资源等,处理一个请求就需要涉及到多个服务的多个线程。TraceSegment 记录了一个请求在一个线程中的执行流程(即 Trace 信息)。将该请求关联的 TraceSegment 串联起来,就能得到该请求对应的完整 Trace。

1、一个Tracesegemnt记录了一个请求在一个线程中的执行流程,一个trace由多个tracesegment构成,一个TraceSegment 是由多个 Span 构成的

下面我们先来介绍 TraceSegment 的核心字段:

traceSegmentId(ID 类型):TraceSegment 的全局唯一标识,是由前面介绍的 GlobalIdGenerator 生成的。
refs(List<TraceSegmentRef> 类型):它指向父 TraceSegment。在我们常见的 RPC 调用、HTTP 请求等跨进程调用中,一个 TraceSegment 最多只有一个父 TraceSegment,但是在一个 Consumer 批量消费 MQ 消息时,同一批内的消息可能来自不同的 Producer,这就会导致 Consumer 线程对应的 TraceSegment 有多个父 TraceSegment 了,当然,该 Consumer TraceSegment 也就属于多个 Trace 了。
relatedGlobalTraces(DistributedTraceIds 类型):记录当前 TraceSegment 所属 Trace 的 Trace ID。
spans(List<AbstractTracingSpan> 类型):当前 TraceSegment 包含的所有 Span。
ignore(boolean 类型):ignore 字段表示当前 TraceSegment 是否被忽略。主要是为了忽略一些问题 TraceSegment(主要是对只包含一个 Span 的 Trace 进行采样收集)。
isSizeLimited(boolean 类型):这是一个容错设计,例如业务代码出现了死循环 Bug,可能会向相应的 TraceSegment 中不断追加 Span,为了防止对应用内存以及后端存储造成不必要的压力,每个 TraceSegment 中 Span 的个数是有上限的(默认值为 300),超过上限之后,就不再添加 Span了。

TraceSegment 中除了 Span 之外,还有另一个需要介绍的重要依赖 —— TraceSegmentRef,TraceSegment 通过 refs 集合记录父 TraceSegment 的信息,它的核心字段大概可以分为 3 类:

逻辑概念:

我们来看下span的管理,当请求通过tomcat的时候,创建一个entryspan,然后调用entryspan的start方法,会把entryspan放入到span队列的activespanstack中,当请求经过springmvc的时候,不会在创建entryspan,只会重新调用entryspan的start方法,当在业务方法中调用接口的first方法的时候,会创建一份localspan,并且把localspan添加到activespanstack中,当firts方法调用结束的时候,localspan会出栈,当调用业务的end方法的时候,会创建一份localspan,并且把localspan添加到activespanstack中,当end方法调用结束的时候,localspan会出栈

接下来使用dubbo接口远程调用say方法的时候,会创建一个exitspan,然后将exitspan添加到activespanstack中,当say方法调结束的时候,会将exitspan出栈,最后方法介绍,第一个entryspan出栈

接下来我们总结下skywalking的核心概念的理论

skywalking的框图如下所示

1.博客参考https://www.upyun.com/opentalk/334.html

我们在一次调用里面,所经历的一个线程,会生成一个 TraceSegment 。这里它经历了 4 个线程,不管是否跨 JOM ,A 里面 1 个,B 里面 1 个,B 里面的 New Thread 1 个,C 里面 1 个,所以它经历了四个线程后就会生成四 TraceSegment 对象。一次调用经过调用经历一个线程就是产生一个TraceSegment,整个一个trace的调用链就是由多个TraceSegment构成的。

TraceSegment对应的就是数据库中segment表,该表中记录了对于的segment信息,我们来看该表的字段信息

CREATE TABLE `segment`  (
`id` varchar() CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL,
`segment_id` varchar() CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
`trace_id` varchar() CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
`service_id` int() DEFAULT NULL,
`service_instance_id` int() DEFAULT NULL,
`endpoint_name` varchar() CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
`endpoint_id` int() DEFAULT NULL,
`start_time` bigint() DEFAULT NULL,
`end_time` bigint() DEFAULT NULL,
`latency` int() DEFAULT NULL,
`is_error` int() DEFAULT NULL,
`data_binary` mediumtext CHARACTER SET utf8 COLLATE utf8_general_ci,
`version` int() DEFAULT NULL,
`time_bucket` bigint() DEFAULT NULL,
PRIMARY KEY (`id`) USING BTREE,
INDEX `SEGMENT_TRACE_ID`(`trace_id`) USING BTREE,
INDEX `SEGMENT_ENDPOINT_ID`(`endpoint_id`) USING BTREE,
INDEX `SEGMENT_LATENCY`(`latency`) USING BTREE,
INDEX `SEGMENT_TIME_BUCKET`(`time_bucket`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic; SET FOREIGN_KEY_CHECKS = ;
  • trace_id:本次调用的唯一id,通过snowflake模式生成
  • endpoint_name:被调用的接口
  • latency:耗时
  • end_time:结束时间戳
  • endpoint_id:被调用的接口的唯一id
  • service_instance_id:被调用的实例的唯一id
  • version:本数据结构的版本号
  • start_time:开始时间戳
  • 我们现在来看下面的一个案例:

这里有一个很重要的字段信息,data_binary,这里面保存了当时TraceSegment下面的全部的span的信息,这里span的信息都是采用Base64编码存储到数据库中的

我们模拟一个user应用调用order应用,我们发起了一个http://10.8.62.148:8094/testport这次调用在segment表中产生了下面三条记录

在链路追踪的页面展示如下情况如下,链路展示是依据segment表中存储的3条数据展示出来的

当在上面的图上选择某一条记录点击的时候,可以在右侧弹出当前TraceSegment下面保存的span信息,span信息数据保存到data_binary这个字段中的

大概的效果就是上面的形式,接下来我们研究具体的原理

TraceSegment下面有span,整个trace的依赖依赖于span

以一个Trace为例:

首先是外部请求调用A,然后A依次同步调用了B和C,而B被调用时会去同步调用D,C被调用的时候会依次同步调用E和F,F被调用的时候会通过异步调用G,G则会异步调用H,最终完成一次调用。

上图是通过Span之间的依赖关系来表现一个Trace,而在时间线上,则可以有如下的表达:

上面我们了解了span之间的关系,接下来我们来看skywalking中是如何实现的

在应用访问serverA的时候,对于入口,不管外围调用是否前置,都会创建一个 entry span,在entryspan中会记录下面的一些字段的信息,当前span属于哪个TraceSegment,当前span是否有父span,当前span的访问的方法的名称等

要创建span, 我们要从当前的http的请求头中提取前置上下文,这里seriviceA是入口的请求第一个点没有前置,所以什么都没拿到。然后会创建一个 exit span ,创建一个最出的埋点。之后会做一个 inject的操作,把当前的上下文例如当前span的id、当前span的访问的方法等放在 HTTP 的头里面,顺带这个 HTTP的调用发到 Service B 上。接下来就会创建一个TraceSegment记录以及包当前创建的entrySpan保存到当前的这个TraceSegment记录中,保存之后就会在segment表中增加一条记录

接下来,

首先是外部请求调用A,然后A依次同步调用了B和C,而B被调用时会去同步调用D,C被调用的时候会依次同步调用E和F,F被调用的时候会通过异步调用G,G则会异步调用H,最终完成一次调用。

上图是通过Span之间的依赖关系来表现一个Trace,而在时间线上,则可以有如下的表达:

skywalking的核心概念的更多相关文章

  1. 领域驱动设计(DDD)部分核心概念的个人理解

    领域驱动设计(DDD)是一种基于模型驱动的软件设计方式.它以领域为核心,分析领域中的问题,通过建立一个领域模型来有效的解决领域中的核心的复杂问题.Eric Ivans为领域驱动设计提出了大量的最佳实践 ...

  2. Javascript本质第一篇:核心概念

    很多人在使用Javascript之前都至少使用过C++.C#或Java,面向对象的编程思想已经根深蒂固,恰好Javascript在语法上借鉴了Java,虽然方便了Javascript的入门,但要深入理 ...

  3. [程序设计语言]-[核心概念]-02:名字、作用域和约束(Bindings)

    本系列导航 本系列其他文章目录请戳这里. 1.名字.约束时间(Binding Time) 在本篇博文开始前先介绍两个约定:第一个是“对象”,除非在介绍面向对象语言时,本系列中出现的对象均是指任何可以有 ...

  4. spring技术核心概念纪要

    一.背景 springframework 从最初的2.5版本发展至今,期间已经发生了非常多的修正及优化.许多新特性及模块的出现,使得整个框架体系显得越趋庞大,同时也带来了学习及理解上的困难. 本文阐述 ...

  5. ElasticSearch学习笔记-01 简介、安装、配置与核心概念

    一.简介 ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进 ...

  6. Playmaker Input篇教程之引入的核心概念

    Playmaker Input篇教程之引入的核心概念 Playmaker Input引入的核心概念 Playmaker引入了4个核心概念:状态机.动作.变量和事件.了解它们是学习操作Playmaker ...

  7. Maven的几个核心概念

    POM (Project Object Model) 一个项目所有的配置都放置在 POM 文件中:定义项目的类型.名字,管理依赖关系,定制插件的行为等等.比如说,你可以配置 compiler 插件让它 ...

  8. 刀哥多线程GCD核心概念gcd

    GCD GCD 核心概念 将任务添加到队列,并且指定执行任务的函数 任务使用 block 封装 任务的 block 没有参数也没有返回值 执行任务的函数 异步 dispatch_async 不用等待当 ...

  9. cocos2d-x一些核心概念截杀

    Cocos2d-x中有很多概念,这些概念很多来源于动画.动漫和电影等行业,例如:导演.场景和层等概念,当然也有些有传统的游戏的概念.Cocos2d-x中核心概念:导演, 场景,层,节点,精灵,菜单动作 ...

随机推荐

  1. [Firefox附加组件]0003.弹出对话框

    Firefox中使用面板(panel)模块来显示弹出对话框,面板的内容通过HTML编写.你可以在面板上运行content script,尽管在面板里的脚本无法直接访问插件代码,但是你可以在面板脚本和插 ...

  2. 读Pyqt4教程,带你入门Pyqt4 _011

    当我们想要改变或者增强已存在的窗口组件时,或者准备从零开始创建自定义窗口组件时,可以使用绘图.我们通过使用PyQt4工具包提供的绘图API来绘图. 绘图在 paintEvent() 方法中进行.绘制代 ...

  3. Java IO(五)字节流 FileInputStream 和 FileOutputStream

    Java IO(五)字节流 FileInputStream 和 FileOutputStream 一.介绍 字节流 InputStream 和 OutputStream 是字节输入流和字节输出流的超类 ...

  4. ForkJoinPool分支合并框架-工作窃取

    Fork/Join 框架 Fork/Join 框架:就是在必要的情况下,将一个大任务,进行拆分(fork)成 若干个小任务(拆到不可再拆时), 再将一个个的小任务运算的结果进行 join 汇总 For ...

  5. while与do-while循环的使用

    /* 1.格式: ①初始化条件 while(②循环条件){ ④循环体 ③迭代条件 } 2.for循环与while可以相互转换的 . */ public class TestWhile { //100以 ...

  6. 使用 git add -p 整理 patch

    背景 当我们修改了代码准备提交时,本地的改动可能包含了不能提交的调试语句,还可能需要拆分成多个细粒度的 pactch. 本文将介绍如何使用 git add -p 来交互式选择代码片段,辅助整理出所需的 ...

  7. seo网站优化收录过少的病因分析-智狐seo顾问

    seo网站优化收录过少的病因分析 很多网站优化人员都了解,一个网站收录的重要性,企业网站要想可以在百度中占据一个良好的排名,获取的权重更高,那么网站收录自然就上去了,很多站长们在操作的过程中就会出现不 ...

  8. Java 蓝桥杯 算法训练 字符串的展开 (JAVA语言实现)

    ** 算法训练 字符串的展开 ** 题目: 在初赛普及组的"阅读程序写结果"的问题中,我们曾给出一个字符串展开的例子:如果在输入的字符串中,含有类似于"d-h" ...

  9. Java实现洛谷 P1007独木桥

    题目背景 战争已经进入到紧要时间.你是运输小队长,正在率领运输部队向前线运送物资.运输任务像做题一样的无聊.你希望找些刺激,于是命令你的士兵们到前方的一座独木桥上欣赏风景,而你留在桥下欣赏士兵们.士兵 ...

  10. Java实现 LeetCode 477 汉明距离总和

    477. 汉明距离总和 两个整数的 汉明距离 指的是这两个数字的二进制数对应位不同的数量. 计算一个数组中,任意两个数之间汉明距离的总和. 示例: 输入: 4, 14, 2 输出: 6 解释: 在二进 ...