golang 性能调优分析工具 pprof(上)篇, 这是下篇。

四、net/http/pprof

4.1 代码例子 1

go version go1.13.9

把上面的程序例子稍微改动下,命名为 demohttp.go:

  1. package main
  2. import (
  3. "bytes"
  4. "fmt"
  5. "io/ioutil"
  6. "log"
  7. "math/rand"
  8. "net/http"
  9. _ "net/http/pprof"
  10. "sync"
  11. )
  12. func main() {
  13. http.HandleFunc("/pprof-test", handler)
  14. fmt.Println("http server start")
  15. err := http.ListenAndServe(":8090", nil)
  16. if err != nil {
  17. log.Fatal(err)
  18. }
  19. }
  20. func handler(resp http.ResponseWriter, req *http.Request) {
  21. var wg sync.WaitGroup
  22. wg.Add(200)
  23. for i := 0; i < 200; i++ {
  24. go cyclenum(30000, &wg)
  25. }
  26. wg.Wait()
  27. wb := writeBytes()
  28. b, err := ioutil.ReadAll(wb)
  29. if err != nil {
  30. resp.Write([]byte(err.Error()))
  31. return
  32. }
  33. resp.Write(b)
  34. }
  35. func cyclenum(num int, wg *sync.WaitGroup) {
  36. slice := make([]int, 0)
  37. for i := 0; i < num; i++ {
  38. for j := 0; j < num; j++ {
  39. j = i + j
  40. slice = append(slice, j)
  41. }
  42. }
  43. wg.Done()
  44. }
  45. func writeBytes() *bytes.Buffer {
  46. var buff bytes.Buffer
  47. for i := 0; i < 30000; i++ {
  48. buff.Write([]byte{'a' + byte(rand.Intn(10))})
  49. }
  50. return &buff
  51. }

4.2 开始分析

4.2.1 在 web 界面上分析

先运行上面的 demohttp.go 程序,执行命令:

go run demohttp.go

然后在浏览器输入:http://localhost:8090/debug/pprof/,查看服务运行情况,如下图:

名称 url 说明
allocs $host/debug/pprof/allocs?debug=1 过去所有内存抽样情况
block $host/debug/pprof/block?debug=1 同步阻塞时程序栈跟踪的一些情况
heap $host/debug/pprof/heap?debug=1 活动对象的内存分配情况
mutex $host/debug/pprof/mutex?debug=1 互斥锁持有者的栈帧情况
profile $host/debug/pprof/profile cpu profile,点击时会得到一个文件,然后可以用 go tool pprof 命令进行分析
threadcreate $host/debug/pprof/threadcreate?debug=1 创建新 OS 线程的堆栈跟踪情况
trace $host/debug/pprof/trace 当前程序执行的追踪情况,点击时会得到一个文件,可以用 go tool trace 命令来分析这个文件

点击上面的链接,就可以查看具体的分析情况。

不断刷新网页,可以看到数据在不断变化。

4.2.2 命令行交互分析

在命令行上运行 demohttp.go 程序,执行命令:

go run demohttp.go

A. 分析 cpu profile

在开启另外一个命令行终端,执行如下命令:

go tool pprof http://localhost:8090/debug/pprof/profile?seconds=70

参数 seconds = 70:进行 70s 的数据样本采集,这个参数可以根据实际情况调整。

上面的命令执行后,会等待 70s , 然后才会进入命令交互界面,如上图

输入 top 命令:

大家发现没,其实与上面 runtime/pprof 在命令行交互时是一样的操作,可以参考上面的字段参数说明。

找出耗时代码部分,也可以用命令:list

top 命令执行后,发现什么问题没?这个 top 命令显示的信息都是系统调用信息耗时,没有用户定义的函数。为什么?下面进行分析。

B. 分析 memory profile

执行命令:

go tool pprof http://localhost:8090/debug/pprof/heap

然后同样输入 top 命令查看函数使用情况,如下图:

其余的跟踪分析命令类似,就不一一分析了。

把上面在终端命令行下交互分析的数据进行可视化分析。

4.2.3 图形可视化分析

A. pprof 图形可视化

在前面可视化分析中,我们了解到可视化最重要有 2 步:1.采集数据 2.图形化采集的数据。

在上面第三节 runtime/pprof 中,进入终端命令行交互操作,然后输入 web 命令,就可以生成一张 svg 格式的图片,用浏览器可以直接查看该图片。我们用同样的方法来试一试。

  1. 输入命令:

go tool pprof http://localhost:8090/debug/pprof/profile?seconds=30

  1. 等待 30s 后输入 web 命令

如下图:

果然生成了一个 svg 文件,在浏览器查看该图片文件,啥有用信息也没有,如下图:

为什么没有有用信息?前面有讲到过,没有用户访问 http server ,需要的程序没有运行,一直阻塞在那里等待客户端的访问连接,所以 go tool pprof 只能采集部分代码运行的信息,而这部分代码又没有消耗多少 cpu。

那怎么办?

一个方法就是用 http 测试工具模拟用户访问。这里用 https://github.com/rakyll/hey 这个工具。

安装 hey:

go get -u github.com/rakyll/hey

安装完成后,进行 http 测试:

hey -n 1000 http://localhost:8090/pprof-test

同时开启另一终端执行命令:

go tool pprof http://localhost:8090/debug/pprof/profile?seconds=120

等待 120s 后,采集信息完成,如下图:

输入 top 命令查看统计信息:

可以看到用户定义的一个最耗时函数是:main.cyclenum。如果要查看这个函数最耗时部分代码,可以用 list cyclenum 命令查看。

我们这里是要生成一张图片,所以输入 web 命令生成图片:

在浏览器上查看 svg 图片:

(图片较大,只截取了部分)

这张图完整的展示了 top 命令的信息。

B. web 可视化

执行命令:

go tool pprof -http=":8080" http://localhost:8090/debug/pprof/profile

同时开启另一终端执行测试命令:

hey -n 200 -q 5 http://localhost:8090/pprof-test

上面 go tool pprof 执行完成后,会自动在浏览器打开一个 http 地址,http://localhost:8080/ui/,如下图:



(截取部分图片)

这样就可以在web浏览器上查看分析数据了。

C. 火焰图

用 http 测试框架 hey 访问,命令为:

hey -n 200 -q 5 http://localhost:8090/pprof-test

在压测的同时开启另一终端执行命令:

go-torch -u http://localhost:8090

来生成火焰图。

运行命令时在终端输出了信息 :

Run pprof command: go tool pprof -raw -seconds 30 http://localhost:8090/debug/pprof/profile

可以看到 go-torch 的原始命令也是用到了 go tool pprof

上面这个命令默认生成了 torch.svg 的火焰图文件,如下:



(截取一部分图展示)

点击方块可以查看更详细信息:

参考

golang 性能调优分析工具 pprof(下)的更多相关文章

  1. golang 性能调优分析工具 pprof (上)

    一.golang 程序性能调优 在 golang 程序中,有哪些内容需要调试优化? 一般常规内容: cpu:程序对cpu的使用情况 - 使用时长,占比等 内存:程序对cpu的使用情况 - 使用时长,占 ...

  2. Golang性能调优入门

    如何利用golang自带的profile工具进行应用程序的性能调优,前一段时间我做的日志分析系统在线上遇到了一个问题,就是分任务的系统down机了,日志处理延迟了10几个小时,这个时候任务分发系统重启 ...

  3. 专题:性能调优之工具---perf

    1. Linux Perf简介 1.1 Perf是什么 Perf 是内置于Linux 内核源码树中的性能剖析(profiling)工具.它基于事件采样原理,以性能事件为基础,支持针对处理器相关性能指标 ...

  4. Kafka性能调优分析-线上环境篇

    一.背景介绍: 在平时的开发中,使用kafka来发送数据已经非常熟悉,但是在使用的过程中,其实并没有比较深入的探索kafka使用过程中 一些参数配置,带来的损失可能就是没有充分的发挥出kfka的优势, ...

  5. Java性能调优—— VisualVM工具基本使用及监控本地和远程JVM进程超详细使用教程

  6. .NET性能调优之一:ANTS Performance Profiler的使用

    .NET性能调优系列文章 系列文章索引 .NET性能调优之一:ANTS Performance Profiler的使用 .NET性能调优之二:使用Visual Studio进行代码度量 .NET性能调 ...

  7. 一份 Tomcat 和 JVM 的性能调优经验总结!拿走不谢

    Tomcat性能调优 找到Tomcat根目录下的conf目录,修改server.xml文件的内容.对于这部分的调优,我所了解到的就是无非设置一下Tomcat服务器的最大并发数和Tomcat初始化时创建 ...

  8. 【Java/Android性能优3】Android性能调优工具TraceView使用介绍

    本文转自:http://blog.csdn.net/innost/article/details/9008691 在软件开发过程中,想必很多读者都遇到过系统性能问题.而解决系统性能问题的几个主要步骤是 ...

  9. 【Java/Android性能优2】Android性能调优工具TraceView介绍

    本文参考:http://www.trinea.cn/android/android-traceview/ Android自带的TraceView堪比java的性能调优工具visualvm线程视图,可以 ...

随机推荐

  1. Apple 订单系统 bug

    Apple 订单系统 bug 看不到最近的购买信息 https://secure1.www.apple.com.cn/shop/order/list refs xgqfrms 2012-2020 ww ...

  2. JavaScript & Automatic Semicolon Insertion

    JavaScript & Automatic Semicolon Insertion ECMA 262 真香警告️ https://www.ecma-international.org/ecm ...

  3. 1月加密货币交易所访问量破3亿!NGK生态星空计划、NGK生态所带来双重利好!

    据最新数据显示,2021年一月份,加密货币交易所网站的访问量急剧上升.约有3.44亿访问者涌入了加密货币交易所,超过2020年12月的1.96亿访问者总数,创2018年1月以来新高. 加密货币交易所网 ...

  4. golang官方嵌入文件到可执行程序

    目录 前言 示例程序 嵌入文件直接访问 嵌入文件列表 总结 前言 在go官方出嵌入文件的方法前我在网上找过,并且自己还研究过,虽然没有问题,但是既然官方支持还是用起来吧. 看了下go源码embed/e ...

  5. 翻译:《实用的Python编程》01_07_Functions

    目录 | 上一节 (1.6 文件) | 下一节 (2.0 处理数据) 1.7 函数 随着程序开始变大,我们会想要有条理地组织这些程序.本节简要介绍函数.库模块以及带有异常的错误处理. 自定义函数 对你 ...

  6. Linux零拷贝技术

    本文转载自Linux零拷贝技术 导语 本文讲解 Linux 的零拷贝技术,云计算是一门很庞大的技术学科,融合了很多技术,Linux 算是比较基础的技术,所以,学好 Linux 对于云计算的学习会有比较 ...

  7. hadoop支持lzo完整过程

    简介 启用lzo 启用lzo的压缩方式对于小规模集群是很有用处,压缩比率大概能降到原始日志大小的1/3.同时解压缩的速度也比较快. 安装lzo lzo并不是linux系统原生支持,所以需要下载安装软件 ...

  8. node初体验(一)

    1.node.js是一个构建在chrome V8引擎上的javascript运行环境 2.node.js特点:单线程.事件驱动.非阻塞IO模型.轻量 3.node.js是单线程的(多个请求都是一个线程 ...

  9. 如何在Pycharm中自动添加时间日期、作者等信息

    参考下面的内容 #_author_='Lucky';#date: ${DATE}

  10. Hbase ——Not only SQL

    HBase -- NoSQL_Not Only SQL NoSQL数据库: 不遵循传统的RDBMS模型 解决数据库的可伸缩性和可用性(多机器) 数据是非关系的(可切分),不使用sql语句 不针对原子性 ...