使用V8和node轻松profile分析nodejs应用程序
简介
我们使用nodejs写好了程序之后,要是想对该程序进行性能分析的话,就需要用到profile工具了。
虽然有很多很方便和强大的第三方profile工具,但是我们这里主要讲解V8和node自带的profile,因为他们已经足够简单和强大了。使用他们基本上可以满足我们的日常分析需要。
下面就一起来看看吧。
使用V8的内置profiler工具
nodejs是运行在V8引擎上的,而V8引擎本身就提供了内置的profile工具,要想直接使用V8引擎,我需要下载V8源代码,然后进行build。一般来说我们有两种build V8的方法。
使用gm来build V8
gm是一个非常方便的all-in-one的脚本,可以用来生成build文件,触发build过程和运行测试用例。
一般来说,gm脚本的位置在:/path/to/v8/tools/dev/gm.py
我们可以为其创建一个alias,方便后面的使用:
alias gm=/path/to/v8/tools/dev/gm.py
build V8:
gm x64.release
build之后进行用例验证:
gm x64.release.check
是不是很简单?
手动build V8
手动build V8就比较麻烦了,我们也可以分为三步,1.生成build文件,2.触发build,3.运行测试用例
我们可以使用gn来为out/foo生成build文件:
gn args out/foo
上面的命令将会开启一个编辑窗口,用来输入gn的参数。
我们可以添加list来查看所有的参数描述:
gn args out/foo --list
当然我们也可以直接指定参数,来创建build文件:
gn gen out/foo --args='is_debug=false target_cpu="x64" v8_target_cpu="arm64" use_goma=true'
除了gn之外,我们还可以使用v8自带的v8gen来创建build文件:
alias v8gen=/path/to/v8/tools/dev/v8gen.py
v8gen -b 'V8 Linux64 - debug builder' -m client.v8 foo
创建好build文件之后,我们就可以进行编译了。
build所有的V8:
ninja -C out/x64.release
只build d8:
ninja -C out/x64.release d8
最后我们运行测试,来验证是否构建成功:
tools/run-tests.py --outdir out/foo
//或者
tools/run-tests.py --gn
生成profile文件
build好V8之后,我们就可以使用其中的命令来生成profile文件了。
找到d8文件:
d8 --prof app.js
通过添加 --prof 参数,我们可以生成一个v8.log文件,这个文件中包含了profiling数据。
注意这时候的v8.log文件虽然不是二进制格式的,但是阅读起来还是有难度的,因为它只是简单的做了log操作,并没有进行有效的统计分析。
我们看下生成的文件:
...
profiler,begin,1000
tick,0x7fff688bbe36,839,0,0x0,6
tick,0x7fff688bc2d2,2081,0,0x0,6
tick,0x100373430,3263,0,0x0,6
code-creation,Builtin,3,3746,0x1008aa020,1634,RecordWrite
code-creation,Builtin,3,3766,0x1008aa6a0,457,EphemeronKeyBarrier
code-creation,Builtin,3,3773,0x1008aa880,44,AdaptorWithBuiltinExitFrame
code-creation,Builtin,3,3781,0x1008aa8c0,294,ArgumentsAdaptorTrampoline
code-creation,Builtin,3,3788,0x1008aaa00,203,CallFunction_ReceiverIsNullOrUndefined
code-creation,Builtin,3,3796,0x1008aaae0,260,CallFunction_ReceiverIsNotNullOrUndefined
code-creation,Builtin,3,3804,0x1008aac00,285,CallFunction_ReceiverIsAny
code-creation,Builtin,3,3811,0x1008aad20,130,CallBoundFunction
...
可以看到日志文件中只记录了事件的发生,但是并没有统计信息。
分析生成的文件
如果想要生成我们看得懂的统计信息,则可以使用:
//windows
tools\windows-tick-processor.bat v8.log
//linux
tools/linux-tick-processor v8.log
//macOS
tools/mac-tick-processor v8.log
来生成可以理解的日志文件。
生成的文件大概是下面样子的:
Statistical profiling result from benchmarks\v8.log, (4192 ticks, 0 unaccounted, 0 excluded).
[Shared libraries]:
ticks total nonlib name
9 0.2% 0.0% C:\WINDOWS\system32\ntdll.dll
2 0.0% 0.0% C:\WINDOWS\system32\kernel32.dll
[JavaScript]:
ticks total nonlib name
741 17.7% 17.7% LazyCompile: am3 crypto.js:108
113 2.7% 2.7% LazyCompile: Scheduler.schedule richards.js:188
103 2.5% 2.5% LazyCompile: rewrite_nboyer earley-boyer.js:3604
103 2.5% 2.5% LazyCompile: TaskControlBlock.run richards.js:324
96 2.3% 2.3% Builtin: JSConstructCall
...
用惯的IDE的同学可能在想,能不能有个web页面来统一展示这个结果呢?
有的,V8提供了profview工具,让我们可以从web UI来分析生成的结果。
profview是一个html工具,我们可以从 https://chromium.googlesource.com/v8/v8.git/+/master/tools/profview/ 下载。
如果要使用profview,我们还需要对第一步生成的v8.log文件进行预处理:
linux-tick-processor --preprocess > v8.json
然后在profview页面上传v8.json进行分析即可。
生成时间线图
--prof 还可以接其他参数,比如 --log-timer-events, 通过使用这个参数可以用来统计V8引擎中花费的时间。
d8 --prof --log-timer-events app.js
tools/plot-timer-events v8.log
第一个命令生成v8.log文件,第二个命令会生成一个timer-events.png图形文件,更加直观的展示数据。
因为生成日志实际上对程序的性能是有一定的影响的,我们还可以为plot-timer-events添加失真因子,来纠正这个问题。如果我们没有指定纠正因子,脚本会自动进行查找。当然,我们也可以向下面这样手动指定:
tools/plot-timer-events --distortion=4500 v8.log
使用nodejs的profile工具
在nodejs 4.4.0之前,只能下载V8的源代码进行编译,才能进行profile。 而在nodejs 4.4.0之后,node命令已经集成了V8的功能。
我们可以使用 node --v8-options 来查看 node中可用的V8参数:
node --v8-options
SSE3=1 SSSE3=1 SSE4_1=1 SAHF=1 AVX=1 FMA3=1 BMI1=1 BMI2=1 LZCNT=1 POPCNT=1 ATOM=0
Synopsis:
shell [options] [--shell] [<file>...]
d8 [options] [-e <string>] [--shell] [[--module] <file>...]
-e execute a string in V8
--shell run an interactive JavaScript shell
--module execute a file as a JavaScript module
Note: the --module option is implicitly enabled for *.mjs files.
The following syntax for options is accepted (both '-' and '--' are ok):
--flag (bool flags only)
--no-flag (bool flags only)
--flag=value (non-bool flags only, no spaces around '=')
--flag value (non-bool flags only)
-- (captures all remaining args in JavaScript)
Options:
--use-strict (enforce strict mode)
type: bool default: false
--es-staging (enable test-worthy harmony features (for internal use only))
type: bool default: false
...
参数很多,同样的我们可以使用 --prof 参数:
node --prof app.js
会在本地目录生成一个类似 isolate-0x102884000-14025-v8.log 的文件。
文件的内容和V8生成的一致,这里就不列出来了。
要想分析这个文件,可以使用:
node --prof-process isolate-0x102884000-14025-v8.log > processed.txt
看下生成的分析结果:
Statistical profiling result from isolate-0x102884000-14025-v8.log, (296 ticks, 4 unaccounted, 0 excluded).
[Shared libraries]:
ticks total nonlib name
6 2.0% /usr/lib/system/libsystem_pthread.dylib
6 2.0% /usr/lib/system/libsystem_kernel.dylib
2 0.7% /usr/lib/system/libsystem_malloc.dylib
1 0.3% /usr/lib/system/libmacho.dylib
1 0.3% /usr/lib/system/libcorecrypto.dylib
[JavaScript]:
ticks total nonlib name
...
[Summary]:
ticks total nonlib name
0 0.0% 0.0% JavaScript
276 93.2% 98.6% C++
24 8.1% 8.6% GC
16 5.4% Shared libraries
4 1.4% Unaccounted
[C++ entry points]:
ticks cpp total name
142 63.1% 48.0% T __ZN2v88internal21Builtin_HandleApiCallEiPmPNS0_7IsolateE
82 36.4% 27.7% T __ZN2v88internal40Builtin_CallSitePrototypeGetPromiseIndexEiPmPNS0_7IsolateE
1 0.4% 0.3% T __ZN2v88internal36Builtin_CallSitePrototypeGetFileNameEiPmPNS0_7IsolateE
...
和V8的也很类似。
从Summary和各个entry points中,我们可以进一步分析程序中到底哪一块占用了较多的CPU时间。
上面的百分百的意思是,在采样的这些数据中,有93.2%的都在运行C++代码。那么我们接下来就应该去看一下,到底是哪些C++代码占用了最多的时间,并找出相应的解决办法。
本文作者:flydean程序那些事
本文链接:http://www.flydean.com/nodejs-profile/
本文来源:flydean的博客
欢迎关注我的公众号:「程序那些事」最通俗的解读,最深刻的干货,最简洁的教程,众多你不知道的小技巧等你来发现!
使用V8和node轻松profile分析nodejs应用程序的更多相关文章
- python程序之profile分析
操作系统 : CentOS7.3.1611_x64 python版本:2.7.5 问题描述 1.Python开发的程序在使用过程中很慢,想确定下是哪段代码比较慢: 2.Python开发的程序在使用过程 ...
- MySQL 使用profile分析慢sql,group left join效率高于子查询
MySQL 使用profile分析慢sql,group left join效率高于子查询 http://blog.csdn.net/mchdba/article/details/54380221 -- ...
- 查看mysql正在执行的SQL语句,使用profile分析SQL执行状态
http://qq85609655.iteye.com/blog/2113960 1)我们先通过status命令查看Mysql运行状态 mysql> status; -------------- ...
- Profile 分析 Erlang 虚拟机源码时要注意的一个问题
最近用 Intel Vtune 剖析 Erlang 虚拟机的运行,想看看那些函数和语句耗时最多,遇到一个小问题,那就是 Vtune 给出的源码和汇编码对应有问题.这个问题在 profile 或 deb ...
- 在 NetBeans IDE 6.0 中分析 Java 应用程序性能
NetBeans IDE 6.0 包含一个强大的性能分析工具,可提供与应用程序运行时行为有关的重要信息.通过 NetBeans 性能分析工具,我们可以方便地在 IDE 中监控应用程序的线程状态.CPU ...
- 教你50招提升ASP.NET性能(三):使用Microsoft的PDBs调试和分析外部的程序集和库
(3)Use Microsoft’s PDBs to debug or profile external assemblies or libraries 招数3: 使用Microsoft的PDBs调试 ...
- Envoy 源码分析--程序启动过程
目录 Envoy 源码分析--程序启动过程 初始化 main 入口 MainCommon 初始化 服务 InstanceImpl 初始化 启动 main 启动入口 服务启动流程 LDS 服务启动流程 ...
- 从程序员的角度分析微信小程序(编程语言:用到什么学什么)
从程序员的角度分析微信小程序(编程语言:用到什么学什么) 一.总结 一句话总结:微信小程序原理就是用JS调用底层native组件,和React Native非常类似.(需要时,用到时再学) 1.选择语 ...
- This Node源码分析
看军哥博客有Rtos的源码分析,手痒耍宝把自己读的源码笔记分享出来.愿与众君互相讨论学习 namespace ros { namespace names { void init(const M_str ...
随机推荐
- Flutter 应用入门:计数器
用Android Studio创建的Flutter应用模板默认是一个简单的计数器示例. // 导入包 import 'package:flutter/material.dart'; // 应用入口,启 ...
- cookie和session会话技术
因为http协议是无状态的,也就是说每个客户端访问服务器端资源时,服务器并不知道该客户端是谁,所以需要会话技术识别客户端状态.会话技术是帮助服务器记住客户端状态的. 一次会话的开始是通过浏览器访问某个 ...
- 9. 细节见真章,Formatter注册中心的设计很讨巧
目录 本文提纲 版本约定 你好,我是A哥(YourBatman). Spring设计了org.springframework.format.Formatter格式化器接口抽象,对格式化器进行了大一统, ...
- sort方法和sorted()函数
sort方法和sorted()函数的区别: 相同点:都能完成排序操作. 不同点: (1)使用sort()方法对list排序会修改list本身,不会返回新list,sort()不能对dict字典进行排序 ...
- ps的参数解释
[root@bogon ~]# ps axuUSER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND user启动进程的用户 pid 表示进程标志 ...
- 使用jib-maven-plugin将Spring Boot项目发布为Docker镜像
目录 介绍 使用 总结 介绍 将spring boot(cloud)项目发布到docker环境作为镜像,一般常用的一个是com.spotify的docker-maven-plugin这个maven插件 ...
- 阿里云 RTC QoS 屏幕共享弱网优化之若干编码器相关优化
屏幕共享是视频会议中使用频率最高的功能之一,但在实际场景中用户所处网络环境复杂,常遇到丢包或者拥塞的情况,所以如何优化弱网环境下的用户体验也成为了音视频通信中重要的一环.本文主要分享阿里云 RTC Q ...
- kioptrixVM3
简介 Vulnhub是一个提供各种漏洞环境的靶场平台. 个人学习目的:1,方便学习更多类型漏洞.2,为OSCP做打基础. 下载链接 https://www.vulnhub.com/entry/kiop ...
- [Usaco2007 Jan]Telephone Lines架设电话线
题目描述 FarmerJohn打算将电话线引到自己的农场,但电信公司并不打算为他提供免费服务.于是,FJ必须为此向电信公司支付一定的费用.FJ的农场周围分布着N(1<=N<=1,000)根 ...
- 2.4V升5V芯片,8uA功耗,低功耗升压电路图
2.4V升5V,可用于USB拔插充电,也可以用于把两节镍氢电池2.4V升压到5V,的固定输出稳压电压值,同时输出电流可达1A,0.5A等 首先是先说下0.5A的这款的话,是比较低功耗的,8uA左右的输 ...