Background

NGINX 是一个通用且流行的应用程序。也是最流行的 Web 服务器,它可用于提供静态文件内容,但也通常与其他服务一起用作分布式系统中的组件,在其中它用作反向代理、负载均衡 或 API 网关。

分布式追踪 distributed tracing 是一种可用于分析与监控应用程序的机制,将追踪在从源到目的的整个过程中的单个请求,这与仅通过单个应用程序域来追踪请求的形式不同。

换句话说,我们可以说分布式追踪是对跨多个系统的多个请求的拼接。拼接通常由一个或多个相关 ID 完成,并且跟踪通常是一组记录的、跨所有系统的结构化日志事件,存储在一个中心位置。

在这种背景的情况下, OpenTracing 应运而生。OpenTracing 是一个与应用供应商无关的 API,它可帮助开发人员轻松地跟踪单一请求的域。目前有多种开源产品都支持 OpenTracing(例如,Jaeger, skywalking 等),并将其作为一种检测分布式追踪的标准化方法。

本文将围绕,从0到1实现在nginx配置分布式追踪的架构的简单实例说明。本文实例使用的组件为

  • nginx-1.22
  • jaeger-all-in-on v1.38
  • nginx-opentracing v1.22
  • jaeger-client-cpp v0.9

源码构建nginx-opentracing

准备nginx-opentracing

nginx-opentracing 仓库中可以看到,官方为每个nginx版本都提供了一个编译好的动态库(Nginx1.19.13+),我们可以直接拿来使用这个动态库,如果你想将这个利用Nginx 提供的编译参数 --add-module=/path/to/module 构建为nginx的内置功能的话,可能会出现一些问题,例如下面的一些错误:

  1. ngx_http_opentracing_module.so/config was found
  1. /root/nginx-opentracing-0.25.0/opentracing//src/ngx_http_opentracing_module.cpp
  2. In file included from /root/nginx-opentracing-0.25.0/opentracing//src/ngx_http_opentracing_module.cpp:1:0:
  3. /root/nginx-opentracing-0.25.0/opentracing//src/load_tracer.h:3:38: fatal error: opentracing/dynamic_load.h: No such file or directory

根据 issue 中查询得知 nginx-opentracing 需要嵌入到nginx中,是需要一些 opentracing-cpp 因为对c++不熟,尝试调试很久还是上面的错误,故直接使用了官方提供的动态库。

准备jaeger-client-cpp

根据 nginx-opentracing 中提到的,还需要一个 jaeger-client-cpptracer 才可以正常运行(这也是作为jaeger架构中的角色)

来到 jaeger-client-cpp 看到Release提供的编译好的动态库已经很久了,而最新版都没有提供相应编译的版本,需要我们自己编译

说明: 编译依赖CMake 3.3+,gcc 4.9.2+

我们的编译环境使用CentOS 7 默认gcc与CMake都符合要求需要自行编译两个的版本。

编译gcc

gcc下载地址:https://ftp.gnu.org/gnu/gcc/

  1. cd gcc-5.4.0
  2. ./contrib/download_prerequisites
  3. mkdir gcc-build-5.4.0
  4. cd gcc-build-5.4.0
  5. /usr/local/src/gcc-5.4.0/configure \
  6. --enable-checking=release \
  7. --enable-languages=c,c++ \
  8. --disable-multilib
  9. make && make install

引用处理 refer 1

  1. cd /usr/bin/
  2. mv gcc gcc_back
  3. mv g++ g++_back
  4. ln -s /usr/local/bin/gcc gcc
  5. ln -s /usr/local/bin/g++ g++

编译时遇到几个问题

/lib64/libstdc++.so.6: version GLIBCXX_3.4.20' not found

gcc 编译,libgcc动态库有改动,恢复原状即可

  1. configure: error: C++ compiler missing or inoperational
  2. make[2]: \*** [configure-stage1-libcpp] Error 1
  3. make[2]: Leaving directory `/home/clay/programming/C++/gcc-4.8.1'
  4. make[1]: \*** [stage1-bubble] Error 2
  5. make[1]: Leaving directory `/home/clay/programming/C++/gcc-4.8.1'
  6. make: \*** [all] Error 2

编译cmake

  1. ./configure --prefix=/path/to/app
  2. make
  3. make install

这里遇到一个小问题 编译过程中遇到 [libstdc++.so.6: version GLIBCXX_3.4.20 not found

因为这里使用了自己编译的gcc版本,需要指定下动态库的路径 refer 2

  1. LD_LIBRARY_PATH=/usr/local/lib64 ./configure --prefix=/usr/local/cmake

编译jaeger-client-cpp

这里根据官方提供的步骤操作即可

  1. cd jaeger-client-cpp-0.9.0/
  2. mkdir build
  3. cd build
  4. # 这里建议使用下强国特色上网,编译过程中会使用Hunter自动下载所需的依赖项
  5. ALL_PROXY=http://x.0.0.x:10811 /usr/local/cmake/bin/cmake ..
  6. make

注:依赖项挺大的,下载时间可能很长,会hang主,只需等待结束即可

​ 编译完成后 libjaegertracing.so.0.9.0 则是我们需要的

编译nginx

  1. ./configure \
  2. --user=web_www \
  3. --group=web_www \
  4. --with-pcre \
  5. --with-compat \
  6. --with-http_ssl_module \
  7. --with-http_gzip_static_module \
  8. --prefix=/root/nginx \
  9. --with-http_stub_status_module

--with-compat 必须加上,表面允许使用动态库,否则编译完在启动时会报下面的错误

  1. nginx: [emerg] module "/root/nginx/conf/ngx_http_opentracing_module.so" is not binary compatible in /root/nginx/conf/nginx.conf:1

遇到的问题,cc nou found,这里只需将 gcc 软连接一份为 cc 即可

配置nginx

准备jaeger-client的配置

jaeger.json

  1. {
  2. "service_name": "nginx", // 服务名
  3. "sampler": {
  4. "type": "const",
  5. "param": 1
  6. },
  7. "reporter": {
  8. "localAgentHostPort": "jaeger:6831" // jaeger agent的地址
  9. },
  10. "headers": { // jaeger的默认的jaeger Baggage头设置
  11. "jaegerDebugHeader": "jaeger-debug-id",
  12. "jaegerBaggageHeader": "jaeger-baggage",
  13. "traceBaggageHeaderPrefix": "uberctx-"
  14. },
  15. "baggage_restrictions": {
  16. "denyBaggageOnInitializationFailure": false,
  17. "hostPort": ""
  18. }
  19. }

在nginx中开启opentracing

  1. # 加载 OpenTracing 动态模块。
  2. load_module conf/ngx_http_opentracing_module.so;
  3. worker_processes 1;
  4. user root root;
  5. events {
  6. worker_connections 1024;
  7. }
  8. http {
  9. log_format opentracing '{"timestamp":"$time_iso8601",'
  10. '"source":"$server_addr",'
  11. '"hostname":"$hostname",'
  12. '"ip":"$http_x_forwarded_for",'
  13. '"traceID":"$opentracing_context_uber_trace_id",'
  14. '"client":"$remote_addr",'
  15. '"request_method":"$request_method",'
  16. '"scheme":"$scheme",'
  17. '"domain":"$server_name",'
  18. '"referer":"$http_referer",'
  19. '"request":"$request_uri",'
  20. '"args":"$args",'
  21. '"size":$body_bytes_sent,'
  22. '"status": $status,'
  23. '"responsetime":$request_time,'
  24. '"upstreamtime":"$upstream_response_time",'
  25. '"upstreamaddr":"$upstream_addr",'
  26. '"http_user_agent":"$http_user_agent",'
  27. '"https":"$https"'
  28. '}';
  29. # 加载 tracer,这里使用的jaeger,需要传递配置文件
  30. opentracing_load_tracer conf/libjaegertracing.so conf/jaeger.json;
  31. # 启用 tracing
  32. opentracing on;
  33. # 设置tag,可选参数
  34. opentracing_tag http_user_agent $http_user_agent;
  35. include mime.types;
  36. default_type application/octet-stream;
  37. sendfile on;
  38. keepalive_timeout 65;
  39. server {
  40. listen 80;
  41. server_name localhost;
  42. location / {
  43. opentracing_operation_name $uri;
  44. opentracing_propagate_context;
  45. root html;
  46. index index.html index.htm;
  47. }
  48. access_log logs/access.log opentracing;
  49. error_page 500 502 503 504 /50x.html;
  50. location = /50x.html {
  51. root html;
  52. }
  53. }
  54. }

注:这里使用的 opentracing-nginx 的动态库为 ot16 ,linux-amd64-nginx-1.22.0-ot16-ngx_http_module.so.tgz ,另外一个版本不兼容,-t 检查语法时会提示

此时我们可以在jaeger上查看,可以看到 NGINX 的 span(因为这里只配置了NGINX,没有配置更多的后端)。

Reference

1 CentOS7 升级 GCC 到 5.4.0 版本

2 libstdc++.so.6: version GLIBCXX_3.4.20 not found

3 nginx load_module

让你的Nginx支持分布式追踪的更多相关文章

  1. [业界方案]用Jaeger来学习分布式追踪系统Opentracing

    [业界方案]用Jaeger来学习分布式追踪系统Opentracing 目录 [业界方案]用Jaeger来学习分布式追踪系统Opentracing 0x00 摘要 0x01 缘由 & 问题 1. ...

  2. 【学习笔记】分布式追踪Tracing

    在软件工程中,Tracing指使用特定的日志记录程序的执行信息,与之相近的还有两个概念,它们分别是Logging和Metrics. Logging:用于记录离散的事件,包含程序执行到某一点或某一阶段的 ...

  3. Apache SkyWalking 为.NET Core带来开箱即用的分布式追踪和应用性能监控

    在大型网站系统设计中,随着分布式架构,特别是微服务架构的流行,我们将系统解耦成更小的单元,通过不断的添加新的.小的模块或者重用已经有的模块来构建复杂的系统.随着模块的不断增多,一次请求可能会涉及到十几 ...

  4. ASP.NET Core使用Jaeger实现分布式追踪

    前言 最近我们公司的部分.NET Core的项目接入了Jaeger,也算是稍微完善了一下.NET团队的技术栈. 至于为什么选择Jaeger而不是Skywalking,这个问题我只能回答,大佬们说了算. ...

  5. SkyWalking 分布式追踪系统

    随着微服务架构的流行,一些微服务架构下的问题也会越来越突出,比如一个请求会涉及多个服务,而服务本身可能也会依赖其他服务,整个请求路径就构成了一个网状的调用链,而在整个调用链中一旦某个节点发生异常,整个 ...

  6. 开源分布式追踪系统 — Jaeger介绍

    目录 一.Jaeger是什么 二.Jaeger架构 1. 术语 2. 架构图 三.关于采样率 四.部署与实践 一.Jaeger是什么 Uber开发的一个受Dapper和Zipkin启发的分布式跟踪系统 ...

  7. Centos7搭建SkyWalking分布式追踪,以mysql为存储

    Skywalking专门为微服务架构和云原生架构系统而设计并且支持分布式链路追踪的APM系统,即应用性能监控系统,为微服务架构和云原生架构系统设计.它通过探针自动收集所需的指标,并进行分布式追踪.通过 ...

  8. 微服务统计,分析,图表,监控, 分布式追踪一体化的 HttpReports 在 .Net Core 的应用

    前言介绍 HttpReports 是针对.Net Core 开发的轻量级APM系统,基于MIT开源协议, 使用HttpReports可以快速搭建.Net Core环境下统计,分析,图表,监控,分布式追 ...

  9. [业界方案] 用SOFATracer学习分布式追踪系统Opentracing

    [业界方案] 用SOFATracer学习分布式追踪系统Opentracing 目录 [业界方案] 用SOFATracer学习分布式追踪系统Opentracing 0x00 摘要 0x01 缘由 &am ...

随机推荐

  1. python基础练习题(题目 计算两个矩阵相加)

    day30 --------------------------------------------------------------- 实例044:矩阵相加 题目 计算两个矩阵相加. 分析:矩阵可 ...

  2. 图数据库|正反向边的最终一致性——TOSS 介绍

    本文首发于 Nebula Graph Community 公众号 Nebula Graph v2.6 当中比较重要的特性之一便是 TOSS.通过本文,我将带你全方位了解 TOSS 为何物. 从一条 G ...

  3. Microsoft Graph 的 .NET 6 之旅

    这是一篇发布在dotnet 团队博客上由微软Graph首席软件工程师 Joao Paiva写的文章,原文地址: https://devblogs.microsoft.com/dotnet/micros ...

  4. 1903021121-刘明伟 实验一 19信计JAVA—Markdown排版学习

    项目 内容 班级博客链接 19信计班(本) 作业要求链接 实验一 课程学习目标 学习使用Markdown排版 这个作业帮助我们实现了什么学习目标 学会使用Markdown排版 任务一:在博客园平台注册 ...

  5. Java学习,利用IDEA开发工具连接redis

    Idea连接redis及Jedis数据操作 注意是否开启了redis服务!!! 1.打开虚拟机终端,查看虚拟机防火墙是否关闭 查看防火墙当前状态命令: $sudo ufw status 我的是默认关闭 ...

  6. 思科,华为l2tp组网,家庭宽带,公司内网数据分离

    拓扑 简介 办公网使用专线接入,拥有固定IP地址,网络出口使用防火墙做NAT,下联交换机接入服务器,办公电脑等,旁挂思科路由器做L2TP LNS 家庭宽带使用ADSL线路,华为路由器做拨号设备与DHC ...

  7. 运维:ITIL V3

    TIL 简史 在20 世纪80 年代末期,英国商务部(OGC,Office Government Commerce)发布了ITIL .OGC 最初的目标是通过应用IT 来提升政府业务的效率:目标是能够 ...

  8. CenterNet训练时黑白图片不能画框的问题

    解决CenterNet在detect.py中不能画框的问题 在第centernet.py的第198行的中加上这一行 image = image.convert('RGB')

  9. 「JOISC 2019 Day4」蛋糕拼接 3

    loj 3039 NKOJ Description \(n\)个蛋糕,每个蛋糕有\(w_i,h_i\).选\(m\)个蛋糕满足\(\sum\limits_{j=1}^mw_{k_j}-\sum\lim ...

  10. 【可视化分析案例】用python分析B站Top100排行榜数据

    一.数据源 之前,我分享过一期爬虫,用python爬取Top100排行榜: 最终数据结果,是这样的: 在此数据基础上,做python可视化分析. 二.数据读取 首先,读取数据源: # 读取csv数据 ...