Linkerd 2.10 系列

Linkerd 2.10 中文手册持续修正更新中:

调试服务网格(service mesh)可能很困难。当某些东西不起作用时,

是代理(proxy)有问题吗?与应用程序(application)?

与客户端(client)?与底层网络?(underlying network)有时,

没有什么比查看原始网络数据更好的了。

如果您需要对进入(entering)和离开(leaving)应用程序的数据包进行

网络级可见性(network-level visibility),

Linkerd 提供了带有一些有用工具的 debug sidecar

proxy sidecar injection 的工作方式类似,

您可以通过在 pod 创建时设置 config.linkerd.io/enable-debug-sidecar: "true" annotation

来向 pod 添加 debug sidecar

为方便起见,linkerd inject 命令提供了

一个 --enable-debug-sidecar 选项来为你做这个注解。

(请注意,Kubernetes pod 中的容器集不是可变的,因此简单地将此 annotation

添加到预先存在的 pod 中是行不通的。它必须在创建 pod 时存在。)

debug sidecar 镜像包含

tshark

tcpdumplsofiproute2

安装后,它会开始使用 tshark 自动记录所有传入和传出的流量,

然后可以使用 kubectl logs 查看这些流量。

或者,您可以使用 kubectl exec 访问容器并直接运行命令。

例如,如果您已经阅读了

Linkerd 入门指南

并安装了 emojivoto 应用程序,并希望调试 voting 服务的流量,您可以运行:

kubectl -n emojivoto get deploy/voting -o yaml \
| linkerd inject --enable-debug-sidecar - \
| kubectl apply -f -

debug sidecar 容器部署到 voting 服务中的所有 pod。

(请注意,此部署中只有一个 Pod,它将被重新创建以执行此

操作 - 请参阅上面有关 Pod 可变性的说明。)

您可以通过列出带有 voting-svc 标签的 pod 中的所有容器来确认调试容器正在运行:

kubectl get pods -n emojivoto -l app=voting-svc \
-o jsonpath='{.items[*].spec.containers[*].name}'

然后,您可以通过简单地运行来查看日志中的实时 tshark 输出:

kubectl -n emojivoto logs deploy/voting linkerd-debug -f

如果这还不够,您可以 exec 到容器并在网络上下文中运行您自己的命令。

例如,如果您想检查请求的 HTTP headers,您可以运行如下代码:

kubectl -n emojivoto exec -it \
$(kubectl -n emojivoto get pod -l app=voting-svc \
-o jsonpath='{.items[0].metadata.name}') \
-c linkerd-debug -- tshark -i any -f "tcp" -V -Y "http.request"

由代理编写的 debug sidecar 在故障排除中

有效的实际错误消息是 Connection Refused 错误,如下所示:

ERR! [<time>] proxy={server=in listen=0.0.0.0:4143 remote=some.svc:50416}
linkerd2_proxy::app::errors unexpected error: error trying to connect:
Connection refused (os error 111) (address: 127.0.0.1:8080)

在这种情况下,可以修改 tshark 命令以侦听错误中提到的特定端口之间的流量,如下所示:

kubectl -n emojivoto exec -it \
$(kubectl -n emojivoto get pod -l app=voting-svc \
-o jsonpath='{.items[0].metadata.name}') \
-c linkerd-debug -- tshark -i any -f "tcp" -V \
-Y "(tcp.srcport == 4143 and tcp.dstport == 50416) or tcp.port == 8080"

请注意,消息 Connection reset by peer 也有类似的错误。

如果您在应用程序日志输出中没有看到相关的错误或消息,则此错误通常是良性的。

在这种情况下,调试容器可能无法帮助解决错误消息。

ERR! [<time>] proxy={server=in listen=0.0.0.0:4143 remote=some.svc:35314}
linkerd2_proxy::app::errors unexpected error: connection error:
Connection reset by peer (os error 104)

当然,这些示例仅在您能够 exec 到 Kubernetes 集群中的任意容器时才有效。

有关此方法的替代方法,请参阅 linkerd tap

Linkerd 2.10(Step by Step)—使用 Debug Sidecar,注入调试容器来捕获网络数据包的更多相关文章

  1. Linkerd 2.10(Step by Step)—设置服务配置文件

    Linkerd 2.10 系列 快速上手 Linkerd v2.10 Service Mesh 腾讯云 K8S 集群实战 Service Mesh-Linkerd2 & Traefik2 部署 ...

  2. Linkerd 2.10(Step by Step)—控制平面调试端点

    Linkerd 2.10 系列 快速上手 Linkerd v2 Service Mesh(服务网格) 腾讯云 K8S 集群实战 Service Mesh-Linkerd2 & Traefik2 ...

  3. Linkerd 2.10(Step by Step)—2. 自动化的金丝雀发布

    通过结合 Linkerd 和 Flagger 来根据服务指标自动金丝雀(canary)发布,从而降低部署风险. Linkerd 2.10 中文手册持续修正更新中: https://linkerd.ha ...

  4. Linkerd 2.10(Step by Step)—4. 如何配置外部 Prometheus 实例

    Linkerd 2.10 系列 快速上手 Linkerd v2 Service Mesh(服务网格) 腾讯云 K8S 集群实战 Service Mesh-Linkerd2 & Traefik2 ...

  5. Linkerd 2.10(Step by Step)—使用 Kustomize 自定义 Linkerd 的配置

    Linkerd 2.10 系列 快速上手 Linkerd v2 Service Mesh(服务网格) 腾讯云 K8S 集群实战 Service Mesh-Linkerd2 & Traefik2 ...

  6. Linkerd 2.10(Step by Step)—多集群通信

    Linkerd 2.10 系列 快速上手 Linkerd v2.10 Service Mesh(服务网格) 腾讯云 K8S 集群实战 Service Mesh-Linkerd2 & Traef ...

  7. Linkerd 2.10(Step by Step)—将 GitOps 与 Linkerd 和 Argo CD 结合使用

    Linkerd 2.10 系列 快速上手 Linkerd v2.10 Service Mesh(服务网格) 腾讯云 K8S 集群实战 Service Mesh-Linkerd2 & Traef ...

  8. Linkerd 2.10(Step by Step)—配置超时

    Linkerd 2.10 系列 快速上手 Linkerd v2 Service Mesh(服务网格) 腾讯云 K8S 集群实战 Service Mesh-Linkerd2 & Traefik2 ...

  9. Linkerd 2.10(Step by Step)—配置重试

    Linkerd 2.10 系列 快速上手 Linkerd v2 Service Mesh(服务网格) 腾讯云 K8S 集群实战 Service Mesh-Linkerd2 & Traefik2 ...

随机推荐

  1. c++debug&注意事项 自用 持续更新

    cin后回车程序直接退出: 加system("pause");在return 0;前面 C++ 控制cout输出的小数位数 C++中的cout.setf().cout.precis ...

  2. 带你解析MySQL binlog

    前言: 我们都知道,binlog可以说是MySQL中比较重要的日志了,在日常学习及运维过程中,也经常会遇到.不清楚你对binlog了解多少呢?本篇文章将从binlog作用.binlog相关参数.解析b ...

  3. MySQL关于日期为零值的处理

    前言: 前面文章我们介绍过日期和时间字段的查询方法,最近遇到日期值为零的问题.原来了解过和 sql_mode 参数设置有关,但还不是特别清楚,本篇文章将探究下MySQL怎么处理日期值为零的问题. 1. ...

  4. Linux上的Shebang符号(#!)

    使用Linux或者unix系统的同学可能都对#!这个符号并不陌生,但是你真的了解它吗? 本文了将给你简单介绍一下Shebang("#!")这个符号. 首先,这个符号(#!)的名称, ...

  5. [转载]层叠与并排win10

    三. 层叠与并排 如果要排列的窗口超过4个,分屏就显得有些不够用了,这时不妨试一试最传统的窗口排列法.具体方法是,右击任务栏空白处,然后选择"层叠窗口"."并排显示窗口& ...

  6. nginx location标签的匹配规则

    location的匹配 匹配符 匹配规则 优先级 = 精确匹配 1 ^~ 以某个字符串开头 2 ~ 区分大小写的正则匹配 3 ~* 不区分大小写的正则匹配 4 !~ 区分大小写不匹配的正则 5 !~* ...

  7. STM32的时钟系统RCC详细整理(转载)

    一.综述: 1.时钟源 在 STM32 中,一共有 5 个时钟源,分别是 HSI . HSE . LSI . LSE . PLL . ①HSI 是高速内部时钟, RC 振荡器,频率为 8MHz : ② ...

  8. json字符串和字典的区别

    json字符串和字典的区别: json: (JavaScript Object Notation)的首字母缩写,字面的意思是(javascript对象表示法),这里说的json指的是类似于javasc ...

  9. Mybatis 逆向工程使用(Day_17)

    有三个方法可以解决所有的问题:接受,改变,离开.不能接受那就改变,不能改变,那就离开. [何为逆向工程?] 众 所 周 知 ,正向工程就是通过JAVA类的设置来生成对应的数据库表. MyBatis逆向 ...

  10. 安卓开发(2)—— Kotlin语言概述

    安卓开发(2)-- Kotlin语言概述 Android的官方文档都优先采用Kotlin语言了,学它来进行Android开发已经是一种大势所趋了. 这里只讲解部分的语法. 如何运行Kotlin代码 这 ...