作者：vivo 互联网前端团队- Yang Kun

本文是上篇文章《Node.js 应用全链路追踪技术——全链路信息获取》的后续。阅读完，再来看本文，效果会更佳哦。

本文主要介绍在Node.js应用中，如何用全链路信息存储技术把全链路追踪数据存储起来，并进行相应的展示，最终实现基于业界通用 OpenTracing 标准的 Zipkin 的 Node.js 方案。

一、背景

目前业界主流的做法是使用分布式链路跟踪系统，其理论基础是来自 Google 的一篇论文《大规模分布式系统的跟踪系统》。

论文如下图所示：

（图片来源：网络）

在此理论基础上，诞生了很多优秀的实现，如 zipkin、jaeger 。同时为了保证 API 兼容，他们都遵循 OpenTracing 标准。那 OpenTracing 标准是什么呢？

OpenTracing 翻译为开发分布式追踪，是一个轻量级的标准化层，它位于应用程序/类库和链路跟踪系统之间的一层。这一层可以用下图表示：

从上图可以知道， OpenTracing 具有以下优势：

统一了 API ，使开发人员能够方便的添加追踪系统的实现。
OpenTracing 已进入 CNCF ，正在为全球的分布式链路跟踪系统，提供统一的模型和数据标准。

大白话解释下：它就像手机的接口标准，当今手机基本都是 typeC 接口，这样方便各种手机能力的共用。因此，做全链路信息存储，需要按照业界公认的 OpenTracing 标准去实现。

本篇文章将通过已有的优秀实现 —— zipkin ，来给大家阐述 Node.js 应用如何对接分布式链路跟踪系统。

二、zipkin

2.1 zipkin 是什么？

zipkin 是 Twitter 基于 Google 的分布式追踪系统论文的开发实现，其遵循 OpenTracing 标准。

zipkin 用于跟踪分布式服务之间的应用数据链路。

2.2 zipkin 架构

官方文档上的架构如下图所示：

为了更好的理解，我这边对架构图进行了简化，简化架构图如下所示：

从上图可以看到，分为三个部分：

第一部分：全链路信息获取，我们不使用 zipkin 自带的全链路信息获取，我们使用 zone-context 去获取全链路信息

第二部分：传输层， 使用 zipkin 提供的传输 api ，将全链路信息传递给 zipkin

第三部分： zipkin 核心功能，各个模块介绍如下：

collector 就是信息收集器,作为一个守护进程，它会时刻等待客户端传递过来的追踪数据，对这些数据进行验证、存储以及创建查询需要的索引。
storage 是存储组件。zipkin 默认直接将数据存在内存中，此外支持使用 ElasticSearch 和 MySQL 。
search 是一个查询进程，它提供了简单的 JSON API 来供外部调用查询。
web UI 是 zipkin 的服务端展示平台，主要调用 search 提供的接口，用图表将链路信息清晰地展示给开发人员。

至此， zipkin 的整体架构就介绍完了，下面我们来进行 zipkin 的环境搭建。

2.3 zipkin 环境搭建

采用 docker 搭建，这里我们使用 docker 中的 docker-compose 来快速搭建 zipkin 环境。

docker-compose.yml 文件内容如下：

version: '3.8'

services:

  elasticsearch:

    image: docker.elastic.co/elasticsearch/elasticsearch:7.5.0

    container_name: elasticsearch

    restart: always

    ports:

      - 9200:9200

    healthcheck:

      test: ["CMD-SHELL", "curl --silent --fail localhost:9200/_cluster/health || exit 1"]

      interval: 30s

      timeout: 10s

      retries: 3

      start_period: 40s

    environment:

      - discovery.type=single-node

      - bootstrap.memory_lock=true

      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"

      - TZ=Asia/Shanghai

    ulimits:

      memlock:

        soft: -1

        hard: -1

  zipkin:

    image: openzipkin/zipkin:2.21

    container_name: zipkin

    depends_on:

      - elasticsearch

    links:

      - elasticsearch

    restart: always

    ports:

      - 9411:9411

    environment:

      - TZ=Asia/Shanghai

      - STORAGE_TYPE=elasticsearch

      - ES_HOSTS=elasticsearch:9200

在上面文件所在的目录下执行 docker-compose up -d 即可完成本地搭建。

搭建完成后，在浏览器中打开地址 http://localhost:9411 ，会看到如下图所示页面：

接着打开地址 http://localhost:9200 ，会看到如下图所示页面：

至此， zipkin 的本地环境就搭建好啦。下面我就将介绍 Node.js 应用如何对接 zipkin。

三、Node.js 接入 zipkin

3.1 搞定全链路信息获取

这个我在《Node.js 应用全链路追踪技术——全链路信息获取》文章中，已经详细阐述了，如何去获取全链路信息。

3.2 搞定传输层

因为 zipkin 是基于 OpenTracing 标准实现的。因此我们只要搞定了 zipkin 的传输层，也就搞定了其他主流分布式追踪系统。

这里我们用到了 zipkin 官方提供的两个 npm 包，分别是：

zipkin
zipkin-transport-http

zipkin 包是官方对支持 Node.js 的核心包。 zipkin-transport-http 包的作用是将数据通过 HTTP 异步发送到 zipkin 。

下面我们将详细介绍在传输层，如何将将数据发送到 zipkin 。

3.3 传输层基础封装

核心代码实现和相关注释如下：

const {

  BatchRecorder,

  Tracer,

  // ExplicitContext,

  jsonEncoder: { JSON_V1, JSON_V2 },

} = require('zipkin')

const { HttpLogger } = require('zipkin-transport-http')

// const ctxImpl = new ExplicitContext();

// 配置对象

const options = {

  serviceName: 'zipkin-node-service',

  targetServer: '127.0.0.1:9411',

  targetApi: '/api/v2/spans',

  jsonEncoder: 'v2'

}

// http 方式传输

async function recorder ({ targetServer, targetApi, jsonEncoder }) => new BatchRecorder({

  logger: new HttpLogger({

    endpoint: `${targetServer}${targetApi}`,

    jsonEncoder: (jsonEncoder === 'v2' || jsonEncoder === 'V2') ? JSON_V2 : JSON_V1,

  })

})

// 基础记录

const baseRecorder = await recorder({

  targetServer: options.targetServer

  targetApi: options.targetApi

  jsonEncoder: options.jsonEncoder

})

至此，传输层的基础封装就完成了，我们抽离了 baseRecorder 出来，下面将会把全链路信息接入到传输层中。

3.4 接入全链路信息

这里说下官方提供的接入 SDK ,代码如下：

const { Tracer } = require('zipkin')

const ctxImpl = new ExplicitContext()

const tracer = new Tracer({ ctxImpl, recorder: baseRecorder })

// 还要处理请求头、手动层层传递等事情

上面的方式缺点比较明显，需要额外去传递一些东西，这里我们使用上篇文章提到的 Zone-Context ，代码如下：

const zoneContextImpl = new ZoneContext()

const tracer = new Tracer({ zoneContextImpl, recorder: baseRecorder })

// 仅此而已，不再做额外处理

对比两者，明显发现， Zone-Context 的实现方式更加的隐式，对代码入侵更小。这也是单独花一篇文章介绍 Zone-Context 技术原理的价值体现。

自此，我们完成了传输层的适配， Node.js 应用接入 zipkin 的核心步骤基本完成。

3.5 搞定 zipkin 收集、存储、展示

这部分中的收集、展示功能， zipkin 官方自带完整实现，无需进行二次开发。存储这块，提供了 MySQL 、 Elasticsearch 等接入方式。可以根据实际情况去做相应的接入。本文采用 docker-compose 集成了 ElasticSearch 。

四、总结

自此，我们已经完成基于业界通用 OpenTracing 标准实现的 zipkin 的 Node.js 方案。希望大家看完这两篇文章，对 Node.js 全链路追踪，有一个整体而清晰的认识。

参考资料：

zipkin 官网

Node.js 应用全链路追踪技术——全链路信息存储的更多相关文章

Node.js 应用全链路追踪技术——[全链路信息获取]
全链路追踪技术的两个核心要素分别是全链路信息获取和全链路信息存储展示. Node.js 应用也不例外,这里将分成两篇文章进行介绍:第一篇介绍 Node.js 应用全链路信息获取, 第二篇介绍 N ...
全链路追踪技术选型：pinpoint vs skywalking
目前分布式链路追踪系统基本都是根据谷歌的<Dapper大规模分布式系统的跟踪系统>这篇论文发展而来,主流的有zipkin,pinpoint,skywalking,cat,jaeger等. ...
Node.js 中开源库探秘 object-assign | 全栈之路
这篇内容呢,讲的是另一个技术栈 Node.js 系列,虽然和咱们这里的主题不是特别吻合,不过嘛,汲取多样性的养分是快速成长的好方法,也是现在流行的全栈工程师的必经之路. 由于这篇内容涉及的是 Node ...
Node.js自动化测试及大规模性能测试技术实现（Java&Node.JS）
后续计划: 改进1:性能测试Tool由Client端设计成Server端,支持分布式中控部署改进2:SocketTestFramework集成WebSocket协议改进3:完善Data Analy ...
[转载]Node入门 » 一本全面的Node.js教程
http://www.nodebeginner.org/index-zh-cn.html 作者: Manuel Kiessling 翻译: goddyzhao & GrayZhang & ...
分布式链路追踪之Spring Cloud Sleuth+Zipkin最全教程！
大家好,我是不才陈某~ 这是<Spring Cloud 进阶>第九篇文章,往期文章如下: 五十五张图告诉你微服务的灵魂摆渡者Nacos究竟有多强? openFeign夺命连环9问,这谁受得 ...
为什么 2020 还要学 Node.js
更佳阅读体验 https://www.yuque.com/sunluyong/node 前言前些日子刷知乎看到个 2019 年初的问题 2019年nodejs凉了吗?凉到什么程度了?才看到问题的时候 ...
深入浅出Node.js（一）：什么是Node.js
Node.js从2009年诞生至今,已经发展了两年有余,其成长的速度有目共睹.从在github的访问量超过Rails,到去年底Node.jsS创始人Ryan Dalh加盟Joyent获得企业资助,再到 ...
Node.js 项目搭建
关于本书致力于教会你如何用Node.js来开发应用,过程中会传授你所有所需的“高级”JavaScript知识.本书绝不是一本“Hello World”的教程. 状态你正在阅读的已经是本书的最终版. ...
深入浅出Node.js（一）：什么是Node.js(转贴)
以下内容转自:http://www.infoq.com/cn/articles/what-is-nodejs/ 作者:崔康 [编者按]:Node.js从2009年诞生至今,已经发展了两年有余,其成长的 ...

随机推荐

i春秋象棋
这是一道非常有意思的一道题,打开后就是一个pve的象棋游戏,我觉得下赢了就应该会出现flag,可惜多次尝试后失败了(果真有点厉害,我一时兴起就玩了好几把,有空试试拿更厉害的电脑跟他对下,如果赢了会怎么 ...
Linux 使用打印机
前言在 deepin 上打印机好使,在我的mint上不好使,简单的查看一下deepin上驱动及软件.安装上就行了. 软件及驱动 ii hpijs-ppds 3.18.12+dfsg0-2 all H ...
MICCAI 论文投稿须知翻译
MICCAI 论文投稿须知翻译以MICCAI 2021 PAPER SUBMISSION AND REBUTTAL GUIDELINES为例,每年投稿须知类似作者信息和rebuttal 本文件包含 ...
安装es可视化软件Kibana
一 Kibana介绍 Kibana 是一款开源的数据分析和可视化平台,它是 Elastic Stack 成员之一,设计用于和 Elasticsearch 协作. 您.可以使用 Kibana 对 Ela ...
C# 11新特性之file关键字
C#11 添加了文件作用域类型功能:一个新的 file 修饰符,可以应用于任何类型定义以限制其只能在当前文件中使用.这样,我们可以在一个项目中拥有多个同名的类. 目录示例 file不可以与其他修饰符 ...
Python：界面开发，wx入门篇
以下内容为本人的学习笔记,如需要转载,请声明原文链接微信公众号「englyf」https://mp.weixin.qq.com/s/3Yb_YAKiMte_f5HanetXiA 本文大概 3617 个 ...
过两年 JVM 可能就要被 GraalVM 替代了
大家好,我是风筝,公众号「古时的风筝」,专注于 Java技术及周边生态. 文章会收录在 JavaNewBee 中,更有 Java 后端知识图谱,从小白到大牛要走的路都在里面. 今天说一说 Graal ...
高可用系列文章之三 - NGINX 高可用实施方案
前文链接高可用系列文章之一 - 概述 - 东风微鸣技术博客 (ewhisper.cn) 高可用系列文章之二 - 传统分层架构技术方案 - 东风微鸣技术博客 (ewhisper.cn) 四 NGINX ...
Jmeter 之吞吐量控制器
作用: 吞吐量控制器可用来模拟混合场景的压测业务,即一部分用户执行场景A,一部分用户执行场景B 字段说明: Total Excutions:执行请求总数 Percent Excutions:执行线程数 ...
02- 快速入门MybatisPlus
创建表现有一张 User 表,其表结构如下: id name age email 1 Jone 18 test1@baomidou.com 2 Jack 20 test2@baomidou.com ...

Node.js 应用全链路追踪技术——全链路信息存储