Node.js 是一个基于事件的平台。这意味着在 Node 中发生的一切都是基于对事件的反应。通过 Node 的事件处理机制遍历一系列回调。

事件的回调,这一切都由一个名为 libuv 的库来处理,它提供了一种称为事件循环的机制。

这个事件循环可能是平台中最被误解的概念。当我们提及事件循环监测的主题时,我们花了很多精力来正确地理解我们实际监视的内容。

在本文中,我将带大家重新认知事件循环是如何工作以及它是如何正确地监视。

常见的误解

Libuv 是向 Node.js 提供事件循环的库。在 libuv 背后的关键人物 Bert Belder 的精彩的演讲 Node 交互的主题演讲 中,演讲开头他使用 Google 图像搜索展示了各种不同方式描述事件循环的图片,但是他指出大部分图片描绘的都是错误的。

让我们来看看最流行的误解。

误解1:在用户代码中,事件循环在单独的线程中运行

误解

用户的 JavaScript 代码运行在主线程上面,而另开一个线程运行事件循环。每次异步操作发生时,主线程将把工作交给事件循环线程,一旦完成,事件循环线程将通知主线程执行回调。

现实

只有一个线程执行 JavaScript 代码,事件循环也运行在这个线程上面。回调的执行(在运行的 Node.js 应用程序中被传入、后又被调用的代码都是一个回调)是由事件循环完成地。稍后我们会深入讨论。

误解2:异步的所有内容都由线程池处理

误解

异步操作,像操作文件系统,向外发送 HTTP 请求以及与数据库通信等都是由 libuv 提供的线程池处理的。

现实

Libuv 默认使用四个线程创建一个线程池来完成异步工作。今天的操作系统已经为许多 I/O 任务提供了异步接口(例子 AIO on Linux)。

只要有可能,libuv 将使用这些异步接口,避免使用线程池。

这同样适用于像数据库这样的第三方子系统。在这里,驱动程序的作者宁愿使用异步接口,而不是使用线程池。

简而言之:只有没有其他方式可以使用时,线程池才将会被用于异步 I/O 。

误解3:事件循环类似栈或队列

误解

事件循环采用先进先出的方式执行异步任务,类似于队列,当一个任务执行完毕后调用对应的回调函数。

现实

虽然涉及到类似队列的结构,事件循环并不是采用栈的方式处理任务。事件循环作为一个进程被划分为多个阶段,每个阶段处理一些特定任务,各阶段轮询调度。

了解事件循环周期的阶段

为了真正地了解事件循环,我们必须明白各个阶段都完成了哪些工作。 希望 Bert Belder 不介意,我直接拿了他的图片来说明事件循环是如何工作的:

事件循环的执行可以分成 5 个阶段,让我们来讨论这些阶段。更加深入的解释见 Node.js 官网

计时器

通过 setTimeout() 和 setInterval() 注册的回调会在此处处理。

IO 回调

大部分回调将在这部分被处理。Node.js 中大多数用户代码都在回调中处理(例如,对传入的 http 请求触发级联的回调)。

IO 轮询

对接着要处理的的事件进行新的轮询。

Immediate 设置

此处处理所有由 setImmediate() 注册的回调。

结束

这里处理所有‘结束’事件的回调。

监测事件循环

我们看到,事实上在 Node 应用程序中进行的所有事件都将通过事件循环运行。这意味着如果我们可以从中获得指标,相应地我们可以分析出有关应用程序整体运行状况和性能的宝贵信息。

没有现成的 API 可以从事件循环中获取运行时指标,因此每个监控工具都提供自己的指标,让我们来看看都有些什么。

记录频率

每次的记录数。

记录持续时间

一个刻度的时间。

由于我们的代理作为本机模块运行,因此这是比较容易地添加探测器为我们提供这些信息。

记录频率以及记录持续事件指标

当我们在不同的负载下进行第一次测试时,结果令人惊讶 - 让我举例说明一下:

在以下情况下,我正在调用一个 express.js 应用程序,对其他 http 服务器进行外拨呼叫。

有以下 4 中情况:

  1. Idle

没有传入请求

  1. ab -c 5

使用 apache bench 工具我一次创建了 5 个并发请求

  1. ab -c 10

一次 10 个并发请求

  1. ab -c 10 (slow backend)

为了模拟出一个很慢的后端,我们让被调用的 http 服务器在 1s 后返回数据。这样造成请求等待后端返回数据,被堆积在 Node 中,产生背压。

事件循环执行阶段

如果我们看看得到的图表,我们可以做一个有趣的观察:

事件循环持续时间和被动态调整频率

如果应用程序处于空闲状态,这意味着没有执行任何任务(定时器、回调等),此时全速运行这些阶段是没有意义的,事件循环就这种情况会在在轮询阶段阻塞一段时间以等待新的外部事件进入。

这也意味着,无负载下的度量(低频,高持续时间)与在高负载下与慢后端相关的应用程序相似。

我们还看到,该演示应用程序在场景中运行得“最好”的是并发 5 个请求。

因此,标记频率和标记持续时间需要基于每秒并发请求量进行度量。

虽然这些数据已经为我们提供了一些有价值的见解,但我们仍然不知道在哪个阶段花费时间,因此我们进一步研究并提出了另外两个指标。

工作处理延迟

这个度量衡量线程池处理异步任务所需的时间。

高工作处理的延迟表示一个繁忙/耗尽的线程池。

为了测试这个指标,我创建了一个使用 Sharp 的模块来处理图像的 express 路由。 由于图像处理开销太大,Sharp 利用线程池来实现。

通过 Apache bench 发起 5 个并发请求到具有图像处理功能的路由与没有使用图片处理的路由有很大不同,可以直接从图表上可以看到。

事件循环延迟

事件循环延迟测量在通过 setTimeout(X) 调度的任务真正得到处理之前需要多长时间。

事件循环高延迟表示事件循环正忙于处理回调。

为了测试这个指标,我创建了一个 express 路由使用了一个非常低效的算法来计算斐波那契。

运行具有 5 个并发连接的 Apache bench,具有计算斐波那契功能的路由显示此刻回调队列处于繁忙状态。

我们清楚地看到,这四个指标可以为我们提供宝贵的见解,并帮助您更好地了解 Node.js 的内部工作。

这些需求仍然需要在更大的图片中去观察,以使其有意义。因此,我们正在收集信息以将这些数据纳入我们的异常检测。

回到事件循环

当然,在不了解如何从可能的行动中解决问题的情况下,衡量标准本身就不会有太大的帮助。当事件循环快耗尽时,这里有几个提示。

事件循环耗尽

利用所有 CPU

Node.js 应用程序在单个线程上运行。在多核机器上,这意味着负载不会分布在所有内核上。使用 Node 附带的 cluster module 可以轻松地为每个 CPU 生成一个子进程。每个子进程维护自己的事件循环,主进程在所有子进程之间透明地分配负载。

调整线程池

如上所述,libuv 将创建一个大小为 4 的线程池。通过设置环境变量 UV_THREADPOOL_SIZE 可以覆盖线程池的默认大小。

虽然这可以解决 I/O 绑定应用程序上的负载问题,我建议多次负载测试,因为较大的线程池可能仍然耗尽内存或 CPU 。

将任务扔给服务进程

如果 Node.js 花费太多时间参与 CPU 繁重的操作,开一些服务进程处理这些繁重任务或者针对某些特定任务使用其它语言编写服务也是一个可行的选择。

总结

我们总结一下我们在这篇文章中学到的内容:

  • 事件循环是使 Node.js 应用程序运行的原因
  • 它的功能经常被误解 - 它有多个阶段组成,各阶段处理特定任务,阶段间轮询调度
  • 事件循环不提供现成的指标,因此收集的指标在 APM 供应商之间是不同的
  • 这些指标清楚地提供了有关瓶颈的有价值的见解,但对事件循环的深刻理解以及正在运行的代码才是关键
  • 在未来,Dynatrace 将会把事件循环添加到第一检测要素,从而将事件循环异常与问题相关联

对我来说,毫无疑问,我们今天刚刚在市场上构建了最全面的事件循环监控解决方案,我非常高兴在未来几个星期内,这个惊人的新功能将推向所有客户。

最后

我们一流的 Node.js 代理团队为了做好事件循环监控尽了很大努力。这篇博客文章中提出的大部分发现都是基于他们对 Node.js 内部运作的深入了解。 我要感谢 Bernhard Liedl ,Dominik Gruber ,GerhardStöbich 和 Gernot Reisinger 所有的工作和支持。

我希望这篇文章使大家在事件循环上有新的认知。请在 Twitter 上关注我 @dkhan。我很乐意回答您在 Twitter 里或下面评论区中的提出的一切问题。

最后和以往一样:下载免费试用版去监控您的完整堆栈,包括Node.js

[译] 所有你需要知道的关于完全理解 Node.js 事件循环及其度量的更多相关文章

  1. 【译】理解node.js事件轮询

    Node.js的第一个基本论点是I/O开销很大. 当前编程技术中等待I/O完成会浪费大量的时间.有几种方法可以处理这种性能上的影响: 同步:每次处理一个请求,依次处理.优点:简单:缺点:任何一个请求都 ...

  2. [译]Node.js - Event Loop

    介绍 在读这篇博客之前,我强列建议先阅读我的前两篇文章: Getting Started With Node.js Node.js - Modules 在这篇文章中,我们将学习 Node.js 中的事 ...

  3. node的事件模块应用(译)

    第一次接触Node.js时,就觉得他只不过是用javascript实现的服务端.但实际上他提供了许多浏览器端不具备的方法,比如EventEmitter类.我们在本文中来学习如何使用EventEmitt ...

  4. [译]Node.js Interview Questions and Answers (2017 Edition)

    原文 Node.js Interview Questions for 2017 什么是error-first callback? 如何避免无止境的callback? 什么是Promises? 用什么工 ...

  5. [译]Testing Node.js With Mocha and Chai

    原文: http://mherman.org/blog/2015/09/10/testing-node-js-with-mocha-and-chai/#.ViO8oBArIlJ 为什么要测试? 在此之 ...

  6. 译\Node.js应用的持续部署

    Node.js应用的持续部署 翻译前 翻译自:https://blog.risingstack.com/continuous-deployment-of-node-js-applications/ 正 ...

  7. [译]How to Install Node.js on Ubuntu 14.04 如何在ubuntu14.04上安装node.js

    原文链接为 http://www.hostingadvice.com/how-to/install-nodejs-ubuntu-14-04/ 由作者Jacob Nicholson 发表于October ...

  8. [译]Node.js : Building RESTful APIs using Loopback and MySQL

    国庆后可能就要使用StrongLoop那套东西来做项目了 原文:http://www.javabeat.net/loopback-mysql/ Loopback是什么? Loopback是一个开源的N ...

  9. [译]Node.js Best Practices - Part 2

    原文: https://blog.risingstack.com/node-js-best-practices-part-2/ 统一风格 在大团队开发JS应用, 创建一个风格指南是很有必要的. 推荐看 ...

随机推荐

  1. winform / Dev全局皮肤组件

    话不多说先上效果图. 由于这是单独的测试项目, 用于演示Dev控件的皮肤样式, 所以上面只是演示了部分控件的效果. 下面则是一些实际项目中的截图: Dev的控件样式不仅美观丰富, 上面仅皮肤设置就有4 ...

  2. 关于MATLAB处理大数据坐标文件2017526

    运行六个特征,提高了3分,也就是说以前做的特征已经用完了,穷途末路,依靠以前的特征已经很难取得进步了,提出以下建议 1.测试集曾经运行错误的数据尽早画出图形,并尽可能发现问题并提出特征 2.运行其他程 ...

  3. 不让bat文件运行命令结束后cmd窗口自动关闭

    方法1假设你的bat名字叫aaa.bat你可以新开一个bat,内容是start aaa.bat然后这个新的bat是不会自动关闭的 方法2要执行bat后不退出,可以在bat里的最后添加pause命令,暂 ...

  4. 【Android Developers Training】 80. 管理网络使用

    注:本文翻译自Google官方的Android Developers Training文档,译者技术一般,由于喜爱安卓而产生了翻译的念头,纯属个人兴趣爱好. 原文链接:http://developer ...

  5. 如何解释json的字符串

    public void getToken(){ String json = getJedis().get("f2b9152f36424e8b8a454df9b50eb743"); ...

  6. 探索Windows命令行系列(7):通过命令编译C#类和Java类

    1.编译 C# 类 1.1.C# 编译工具 1.2.编译一个 C# 类 1.3.编译多个 C# 类 2.编译 Java 类 2.1.Java 编译工具 2.2.编译 Java 类 3.组合命令符 4. ...

  7. RabbitMQ插件安装

    RabbitMQ的有些插件没有集成在初始的安装中,它们需要额外安装,这些文件的后缀为.ez,安装时需要将.ez文件拷贝到安装的插件目录.以下是不同系统中默认安装的插件目录路径: 插件目录 Linux ...

  8. usaco training 4.2.3 Job Processing 题解

    Job Processing题解 IOI'96 A factory is running a production line that requires two operations to be pe ...

  9. Java 9 揭秘(9. 打破模块封装)

    Tips 做一个终身学习的人. 在此章节中,主要介绍以下内容: 什么是打破模块的封装 如何使用命令行选项将依赖项(添加需要)添加到模块 如何使用--add-exports命令行选项导出模块的未导出包, ...

  10. JFile的导入xlsx与xls

    首先需要有JAVA的一些jar包 下载地址:http://download.csdn.net/detail/qq_35980546/9892511 你要先配置好路由,还有能拿到绝对路径才行 下面直接给 ...