Docker 自带的监控子命令

ps

docker container ps查看当前运行的容器。

新版的 Docker 提供了一个新命令 docker container ls,其作用和用法与 docker container ps 完全一样。不过 ls 含义可能比 ps 更准确

top

执行 docker container top [container] 命令,查看容器运行了哪些进程

stats

docker container stats 用于显示每个容器各种资源的使用情况。

sysdig

sysdig 是一个轻量级的系统监控工具,同时它还原生支持容器。通过 sysdig 我们可以近距离观察 linux 操作系统和容器的行为。

安装和运行 sysdig 的最简单方法是运行 Docker 容器,命令行为:

docker container run -it --rm --name=sysdig --privileged=true

​ --volume=/var/run/docker.sock:/host/var/run/docker.sock

​ --volume=/dev:/host/dev

​ --volume=/proc:/host/proc:ro

​ --volume=/boot:/host/boot:ro

​ --volume=/lib/modules:/host/lib/modules:ro

​ --volume=/usr:/host/usr:ro

​ sysdig/sysdig

sysdig 容器是以 privileged方式运行,而且会读取操作系统 /dev/proc 等数据

通过 docker container exec -it sysdig bash 进入容器,执行 csysdig 命令,将以交互方式启动 sysdig

这是一个类似 linux top 命令的界面。sysdig 按不同的 View 来监控不同类型的资源,点击底部 Views 菜单(或者按 F2),显示 View 选择列表

回车或者双击 Containers,进入容器监控界面。

sysdig 会显示该 Host 所有容器的实时数据,每两秒刷新一次。各列数据的含义也是自解释的,如果不清楚,可以点一下底部 Legend(或者按 F7)。如果想按某一列排序,比如按使用的内存量,很简单,点一下列头 VIRT

如果想看某个容器运行的进程,比如 weave将光标移到目标容器,然后回车或者双击。

还可以继续双击查看进程中的线程。

返回上一级,按退格键即可。

点击底部 Search菜单,然后输入关键字可以进行查找。如下图,关键字为 service

点击底部 Pause 菜单,暂停页面刷新。

sysdig 的特点如下:

  1. 监控信息全,包括 Linux 操作系统和容器。
  2. 界面交互性强。

sysdig 显示的是实时数据,看不到变化和趋势。而且是命令行操作方式,需要 ssh 到 Host 上执行,会带来一些不便。

Weave Scope

Weave Scope 的最大特点是会自动生成一张 Docker 容器地图,让我们能够直观地理解、监控和控制容器。如图

安装

执行如下脚本安装运行 Weave Scope。

curl -L git.io/scope -o /usr/local/bin/scope

chmod a+x /usr/local/bin/scope

scope launch

scope launch 将以容器方式启动 Weave Scope。

容器监控

Weave Scope 地图中间显示了 Host 当前运行的容器,不过少了几个 weave 相关的容器。

Weave Scope 将容器分为两类:Weave 自己的容器 System Container,和其他容器 Application Container,默认只显示后者。

Weave Scope 界面是一个可交互的地图,使用起来很方便。比如点击地图左下角选择开关 All

点击 CPU 选择器。将鼠标放到容器图标上,则会显示具体的 CPU%。

如果要查看容器的详细信息,比如bbox1,可以点击该容器的图标。

详细信息包括这么几部分:

Status

CPU、内存的实时使用情况以及历史曲线。

INFO

容器 image、启动命令、状态、网络等信息。

PROCESSES

容器中运行的进程。

ENVIRONMENT VARIABLES

环境变量。

DOCKER LABELS

容器启动命令。

IMAGE

镜像详细信息。

在容器信息的上面还有一排操作按钮。

Weave Scope 多主机监控

点击顶部 HOSTS 菜单项,地图将显示当前 host。

host 当前的资源使用情况和历史曲线一览无余。除此之外也能很方便地查看 host 上运行的进程和容器列表,点击容器名字还可以打开此容器的信息页面。

host 页面上部有一个按钮,点击可直接打开 host 的 shell 窗口

多主机监控

两个 Docker Host:

node3: 192.168.56.180.5
node2: 192.168.56.180.4

在两个 host 上都执行如下命令:

scope launch 192.168.180.5 192.168.180.4

点击 CONTAINERS 菜单项,将显示部署环境中所有的容器。

cAdvisor

在 host 中运行 cAdvisor 容器。

docker run

--volume=/:/rootfs:ro

--volume=/var/run:/var/run:rw

--volume=/sys:/sys:ro

--volume=/var/lib/docker/:/var/lib/docker:ro

--publish=8080:8080

--detach=true

--name=cadvisor

google/cadvisor:latest

监控 Docker Host

cAdvisor 会显示当前 host 的资源使用情况,包括 CPU、内存、网络、文件系统等。


监控容器

点击 Docker Containers 链接。

点击容器可以进入容器里查看,容器的信息

cAdvisor 的主要功能主要两点:

  1. 展示 Host 和容器两个层次的监控数据。
  2. 展示历史变化数据。

由于 cAdvisor 提供的操作界面略显简陋,而且需要在不同页面之间跳转,并且只能监控一个 host,这不免会让人质疑它的实用性。但 cAdvisor 的一个亮点是它可以将监控到的数据导出给第三方工具,由这些工具进一步加工处理。

可以把 cAdvisor 定位为一个监控数据收集器,收集和导出数据是它的强项,而非展示数据。

Prometheus

Prometheus 是一个非常优秀的监控工具。准确的说,应该是监控方案。Prometheus 提供了监控数据搜集、存储、处理、可视化和告警一套完整的解决方案。

Prometheus 的架构

Prometheus Server

Prometheus Server 负责从 Exporter 拉取和存储监控数据,并提供一套灵活的查询语言(PromQL)供用户使用。

Exporter

Exporter 负责收集目标对象(host, container…)的性能数据,并通过 HTTP 接口供 Prometheus Server 获取。

可视化组件

监控数据的可视化展现对于监控方案至关重要。以前 Prometheus 自己开发了一套工具,不过后来废弃了,因为开源社区出现了更为优秀的产品 Grafana。Grafana 能够与 Prometheus 无缝集成,提供完美的数据展示能力。

Alertmanager

用户可以定义基于监控数据的告警规则,规则会触发告警。一旦 Alermanager 收到告警,会通过预定义的方式发出告警通知。支持的方式包括 Email、PagerDuty、Webhook 等.

多维数据模型

  1. 通过维度对数据进行说明,附加更多的业务信息,进而满足不同业务的需求。同时维度是可以动态添加的,比如再给数据加上一个 user 维度,就可以按用户来统计容器内存使用量了。

  2. Prometheus 丰富的查询语言能够灵活、充分地挖掘数据的价值。前面示例中的 avg、sum、by 只是查询语言中很小的一部分功能,已经为我们展现了 Prometheus 对多维数据进行分片、聚合的强大能力。

    部署

    环境说明

    通过 Prometheus 监控两台 Docker Host:192.168.180.4 和 192.168.180.5,监控 host 和容器两个层次的数据。

    按照架构图,运行如下组件:

    Prometheus Server

    Prometheus Server 本身也将以容器的方式运行在 host 192.168.180.5 上。

    Exporter

    Prometheus 有很多现成的 Exporter,完整列表请参考 https://prometheus.io/docs/instrumenting/exporters/

    本次实验使用:

    1. Node Exporter,负责收集 host 硬件和操作系统数据。它将以容器方式运行在所有 host 上。
    2. cAdvisor,负责收集容器数据。它将以容器方式运行在所有 host 上。

    Grafana

    显示多维数据,Grafana 本身也将以容器方式运行在 host 192.168.56.103 上。

    运行 Node Exporter

    在两个 host 上执行如下命令:

docker run -d -p 9100:9100
-v "/proc:/host/proc"
-v "/sys:/host/sys"
-v "/:/rootfs"
--net=host
prom/node-exporter
--path.procfs /host/proc
--path.sysfs /host/sys
--collector.filesystem.ignored-mount-points "^/(sys|proc|dev|host|etc)($|/)"

注意,使用--net=host,这样 Prometheus Server 可以直接与 Node Exporter 通信。

Node Exporter 启动后,将通过 9100 提供 host 的监控数据。在浏览器中通过 http://192.168.180.4:9100/metrics 测试一下。

##### 运行 cAdvisor

在两个 host 上执行如下命令:

docker run
--volume=/:/rootfs:ro
--volume=/var/run:/var/run:rw
--volume=/sys:/sys:ro
--volume=/var/lib/docker/:/var/lib/docker:ro
--publish=8080:8080
--detach=true
--name=cadvisor
--net=host
google/cadvisor:latest

##### 运行 Prometheus Server

在 host 192.168.56.103 上执行如下命令:

docker run -d -p 9090:9090
-v /root/prometheus.yml:/etc/prometheus/prometheus.yml
--name prometheus
--net=host
prom/prometheus

prometheus.yml 是 Prometheus Server 的配置文件

最重要的配置是:

static_configs:
- targets: ['localhost:9090','localhost:8080','localhost:9100','192.168.56.180.5:9090','192.168.180.4:9100']

指定从哪些 exporter 抓取数据。这里指定了两台 host 上的 Node Exporter 和 cAdvisor。

另外 localhost:9090 就是 Prometheus Server 自己,可见 Prometheus 本身也会收集自己的监控数据。同样地,可以通过 http://192.168.180.5:9090/metrics 测试一下。

在浏览器中打开 http://192.168.180.5:9090 ,点击菜单 Status -> Targets

TargetState 都是 UP,说明 Prometheus Server 能够正常获取监控数据。

运行 Grafana

在 host 192.168.56.103 上执行如下命令:

[top]
docker run -d -i -p 3000:3000
-e "GF_SERVER_ROOT_URL=http://grafana.server.name"
-e "GF_SECURITY_ADMIN_PASSWORD=secret"
--net=host
grafana/grafana

注意,这里我们使用了 --net=host,这样 Grafana 可以直接与 Prometheus Server 通信

-e "GF_SECURITY_ADMIN_PASSWORD=secret 指定了 Grafana admin用户密码 secret

Grafana 启动后。在浏览器中打开 http://192.168.180.5:3000/

配置

然后就可以展示数据

from cloudman https://home.cnblogs.com/u/CloudMan6/

docker_监控的更多相关文章

  1. zabbix监控docker容器状态

    前言:前段时间在部署zabbix,有个需求就是需要监控容器的状态 也就是cpu 内存 io的占用,于是就自己写了一个脚本,以及模板,在这里分享一下 嘿嘿 : ) 废话我也就不多说,直接开始 首选,za ...

  2. 使用Monit监控本地进程

    目前用它监控某些服务,失败自动重启,同时监控特定的日志文件,如果有变化,就发邮件报警 安装不细写了,网上好多 我先用cat /proc/version看了下我的系统是el6的,于是wget http: ...

  3. node服务的监控预警系统架构

    需求背景 目前node端的服务逐渐成熟,在不少公司内部也开始承担业务处理或者视图渲染工作.不同于个人开发的简单服务器,企业级的node服务要求更为苛刻: 高稳定性.高可靠性.鲁棒性以及直观的监控和报警 ...

  4. 采用MiniProfiler监控EF与.NET MVC项目(Entity Framework 延伸系列1)

    前言 Entity Framework 延伸系列目录 今天来说说EF与MVC项目的性能检测和监控 首先,先介绍一下今天我们使用的工具吧. MiniProfiler~ 这个东西的介绍如下: MVC Mi ...

  5. Logstash实践: 分布式系统的日志监控

    文/赵杰 2015.11.04 1. 前言 服务端日志你有多重视? 我们没有日志 有日志,但基本不去控制需要输出的内容 经常微调日志,只输出我们想看和有用的 经常监控日志,一方面帮助日志微调,一方面及 ...

  6. C# 利用性能计数器监控网络状态

    本例是利用C#中的性能计数器(PerformanceCounter)监控网络的状态.并能够直观的展现出来 涉及到的知识点: PerformanceCounter,表示 Windows NT 性能计数器 ...

  7. 使用Zabbix监控Oracle数据库

    Orabbix介绍 监控Oracle数据库我们需要安装第三方提供的Zabbix插件,我们先测试比较有名的Orabbix,http://www.smartmarmot.com/product/orabb ...

  8. 【开源】.net 分布式架构之监控平台

    开源地址:http://git.oschina.net/chejiangyi/Dyd.BaseService.Monitor .net 简单监控平台,用于集群的性能监控,应用耗时监控管理,统一日志管理 ...

  9. Opserver开源的服务器监控系统(ASP.NET)

    Opserver是Stack Exchange下的一个开源监控系统,系统本身由C#语言开发的ASP.NET(MVC)应用程序,无需任何复杂的应用配置,入门很快.下载地址:https://github. ...

随机推荐

  1. word中字体大小(pt)和网页中css设置font-size时用的px大小对应关系

    pt与px转换关系为 1px= 0.75pt. 所以word中五号字体(10.5pt)在网页中对应的大小为font-size:14px.(10.5 / 0.75 = 14) 初号44pt 小初36pt ...

  2. Android为TV端助力 UDP协议

    废话不多说.直接上代码! 一. 接收端 1.创建UDP连接 public void init() { try { //开关的作用 isRunning = true; DatagramSocket mU ...

  3. js计算剩余分钟

    // 剩余时间提醒 function checkTime() { if (timeCompare()) { document.getElementById('distanceDeadline').in ...

  4. SQL server 远程连接不成功解决

    一直以来打算自己做一个博客网站,前段时间开始准备做了,正好碰上新睿云服务器免费一年的活动,赶紧拿下.装好了sqlserver ,用本地访问没有问题,但是关键是外网访问一直不行找了好多资料最终才搞定.下 ...

  5. Linux内存描述之内存节点node--Linux内存管理(二)

    1 内存节点node 1.1 为什么要用node来描述内存 这点前面是说的很明白了, NUMA结构下, 每个处理器CPU与一个本地内存直接相连, 而不同处理器之前则通过总线进行进一步的连接, 因此相对 ...

  6. mysql解决select * from 表名 (where + 约束条件为空)

    mysql解决select * from 表名 (where + 约束条件为空),示例如下: SELECT * from tableName WHERE name is NULL; 从 tableNa ...

  7. RH2288V3服务器 硬件安装以及更换硬件

    滑道类型:L型滑道.可伸缩滑道.报轨 L型滑道:只适用于华为机柜. 准备工具:防静电带或者防静电手套.螺丝刀.浮动螺母安装条. 安装服务器步骤: 1.安装L型滑道   2.安装浮动螺母  3.安装服务 ...

  8. 完成代码将x插入到该顺序有序线性表中,要求该线性表依然有序

    #include <stdio.h> #include <malloc.h> int main(void) { int i, n; double s = 1.3; double ...

  9. SQLServer之创建DML AFTER INSERT触发器

    DML AFTER INSERT触发器创建原理 触发器触发时,系统自动在内存中创建deleted表或inserted表,内存中创建的表只读,不允许修改,触发器执行完成后,自动删除. insert触发器 ...

  10. Android Studio教程08-与其他app通信

    目录 1.向另外一个应用发送用户 1.1. 构建隐含Intent 1.2. 验证是否存在接收Intent的应用 1.3. 启动具有Intent的Activity 2. 获取Activity的结果响应 ...