模块化是一种将软件功能抽离成独立、可交互的软件设计技术，能促进大型应用程序和系统的构建。

　　Node.js内置了两种模块系统，分别是默认的CommonJS模块和浏览器所支持的ECMAScript模块。

　　其中，ECMAScript模块是在8.5.0版本中新增的，后面又经过了几轮的迭代。本文若无特别说明，那么分析的都是CommonJS模块。

　　顺便说一句，本系列分析的是Node.js的最新版本18.0.0，在Github上下载源码后，可以关注下面3个目录。

├── deps          第三方依赖

├── lib           对外暴露的标准库JavaScript源码，例如path、fs等

├── src           支撑Node运行的C/C++ 源码文件，例如HTTP解析、进程处理等

　　本系列所有的示例源码都已上传至Github，点击此处获取。

　　还有一点需要指出，Node.js的官方说明文档，是我目前为止遇到的比较符合人类阅读的文档。

一、基础语法

　　先来分析一下CommonJS模块的基础语法，在Node.js中，可通过 module.exports 和 exports 来导出一个模块，再通过 require() 来导入一个模块。

　　来看个简单的示例，先在 1.js 文件中声明 human 对象，然后使用 module.exports 导出，然后在 2.js 中导入 1.js 文件，打印输出。

// 1.js

const human = {

  name: 'strick'

}

module.exports = human;

// 2.js

const human = require('./1.js');

console.log(human);  // { name: 'strick' }

　　exports 是 module.exports 的快捷方式，但是不能对其直接赋值，像下面这样导出的就是一个空对象。

// 3.js

exports = {

  name: 'strick'

};

// 2.js

const human = require('./3.js');

console.log(human);  // {}

　　接下来换一种写法，为 exports 添加一个属性，这样就能正确导出。

// 3.js

exports.human = {

  name: 'strick'

};

// 2.js

const human = require('./3.js');

console.log(human);  // { human: { name: 'strick' } }

　　module.exports 导出了它所指向的对象，而 exports 导出的是对象的属性。

二、CommonJS原理

　　在Node.js中，可分成两大类的模块：核心模块和第三方模块。

　　其中核心模块又分成 built-in 模块和 native 模块，前者由C/C++编写，存在于源码的src目录中；后者由JavaScript编写，存在于lib目录中。

　　注意，在 lib/internal/modules 目录中，可以查看两种模块系统的源码。

　　所有非Node.js自带的模块统称为第三方模块，也就是任意文件，大家自己写的业务代码以及依赖的第三方应用库都属于此范畴。

　　Node.js会使用模块封装器（如下所示）将模块中的代码包裹，形成模块作用域，这样就能避免模块之间的作用域污染。

(function(exports, require, module, __filename, __dirname) {

    // 模块代码实际存在于此处

});

　　__filename可以得到当前模块的绝对路径加文件名。__dirname表示当前模块的目录名，也包含绝对路径，与 path.dirname() 相同。

console.log(__filename);    // /Users/strick/code/web/node/01/4.js

console.log(__dirname);     // /Users/strick/code/web/node/01

1）require()

　　在lib/internal/modules/cjs/loader.js中声明了 require() 函数，requireDepth 记载了模块加载的深度。

Module.prototype.require = function(id) {

  validateString(id, 'id');    // 判断id变量是否是字符串类型

  if (id === '') {

    throw new ERR_INVALID_ARG_VALUE('id', id, 'must be a non-empty string');

  }

  requireDepth++;

  try {

    return Module._load(id, this, /* isMain */ false);

  } finally {

    requireDepth--;

  }

};

　　在 _load() 中实现了主要的加载逻辑，源码比较长，做了些删减，只列出了关键部分。

Module._load = function(request, parent, isMain) {

  // 解析模块的路径和名称

  const filename = Module._resolveFilename(request, parent, isMain);

  // 核心模块使用 node: 前缀，会绕过 require 缓存

  if (StringPrototypeStartsWith(filename, 'node:')) {

    const id = StringPrototypeSlice(filename, 5);    // Slice 'node:' prefix

    const module = loadNativeModule(id, request);

    if (!module?.canBeRequiredByUsers) {

      throw new ERR_UNKNOWN_BUILTIN_MODULE(filename);

    }

    return module.exports;

  }

  // 第一种情况：如果缓存中已经存在此模块，那么返回模块的 exports 属性

  const cachedModule = Module._cache[filename];

  if (cachedModule !== undefined) {

    updateChildren(parent, cachedModule, true);

    if (!cachedModule.loaded) {

      const parseCachedModule = cjsParseCache.get(cachedModule);

      if (!parseCachedModule || parseCachedModule.loaded)

        return getExportsForCircularRequire(cachedModule);

      parseCachedModule.loaded = true;

    } else {

      return cachedModule.exports;

    }

  }

  // 第二种情况：如果是核心模块，那么调用 NativeModule.prototype.compileForPublicLoader() 返回模块的 exports 属性

  const mod = loadNativeModule(filename, request);

  if (mod?.canBeRequiredByUsers &&

      NativeModule.canBeRequiredWithoutScheme(filename)) {

    return mod.exports;

  }

  // 第三种情况：如果是第三方文件，那么创建一个新模块并加载文件内容，再将其保存到缓存中

  const module = cachedModule || new Module(filename, parent);

  Module._cache[filename] = module;

  return module.exports;

};

　　在 _load() 方法中，会先判断 node: 前缀（在官方文档的核心模块中有过介绍），然后列出3种加载情况：

如果缓存中已经存在此模块，那么返回模块的 exports 属性。
如果是核心模块，那么调用 NativeModule.prototype.compileForPublicLoader() 返回模块的 exports 属性。
如果是第三方文件，那么创建一个新模块并加载文件内容，再将其保存到缓存中。

　　Node.js在加载JS文件时，会先判断是否有缓存，然后读取文件内容，再调用 _compile() 进行编译，下面的源码也做了删减。

　　还有另外两种 .json 和 .node 后缀的文件加载过程在此省略。

Module._extensions['.js'] = function(module, filename) {

  // 如果已经分析了源，那么它将被缓存

  const cached = cjsParseCache.get(module);

  let content;

  if (cached?.source) {

    content = cached.source;

    cached.source = undefined;

  } else {

    content = fs.readFileSync(filename, 'utf8');

  }

  module._compile(content, filename);

};

　　在 _compile() 方法中会调用vm模块创建沙盒，再执行函数代码，源码比较长，在此省略。

　　注意，虽然 vm 可以在V8虚拟机的上下文中编译和执行JavaScript代码，但是它比eval()更为安全，因为它运行的脚本无权访问外部作用域。

2）加载顺序

　　经过上面的源码分析，可知加载顺序是先缓存，再核心模块，最后第三方模块，再详细一点的话就是：

　　（1）缓存，模块在第一次加载后被缓存，也就是说，解析相同的文件，会返回完全相同的对象，除非修改require.cache。

　　（2）核心模块，部分核心模块已被编译成二进制文件，加载到了内存中。

　　（3）文件模块的加载过程如下：

优先加载带' /'、'./' 或 '../' 路径前缀的模块。
若文件没有后缀，则依次添加 .js、.json 和 .node 尝试加载。
若模块没有路径来指示文件，则该模块必须是核心模块或从 node_modules 目录加载。
再找不到就抛出 MODULE_NOT_FOUND 错误。

　　（4）目录作为模块的加载过程如下：

先将目录当成包来处理，查找 package.json 文件，读取 main 字段描述的入口文件。
若没有 package.json，main 字段缺失或无法解析时，尝试依次加载目录中的 index.js、index.json 或 index.node 文件。
如果这些尝试都失败，则抛出错误，Error: Cannot find module 'xx/xx.js'。

　　（5）从 node_modules 目录加载，若不是核心模块并且没有路径前缀，那么从当前模块的目录向上查找，并添加 /node_modules，直至根目录为止。

　　例如，在'/Users/strick/code/tmp.js' 中调用require('test.js')，那么将按以下顺序查找：

/Users/strick/code/node_modules/test.js
/Users/strick/node_modules/test.js
/Users/node_modules/test.js
/node_modules/test.js

　　（6）从全局目录加载，一种官方不推荐的加载方式。

　　如果 NODE_PATH 环境变量设置为以冒号分隔的绝对路径列表，则 Node.js 将在这些路径中搜索模块（如果它们在其他地方找不到）。

3）循环引用

　　在Node.js中，当两个模块通过 require() 函数加载对方时，就形成了循环引用，但不会形成死循环。

　　下面的示例来自于官网，对其做了些调整。

　　先创建 a.js，在加载 b 模块之前，done 是 false，并且声明了一个 globalVar 变量，没有为其添加任何声明变量的关键字，在 b 模块加载完成后，done 赋值为 true。

console.log('a starting');

exports.done = false;

globalVar = '全局变量'; // 在a模块中声明的全局变量

const b = require('./b.js');

console.log('在a模块中, b.done = %j', b.done);

exports.done = true;

console.log('a done');

　　再创建 b.js，在加载 a 模块之前，done 也是 false，在 a 模块加载完成之后，done 也赋值为 true。

console.log('b starting');

exports.done = false;

const a = require('./a.js');

console.log('在b模块中, a.done = %j', a.done);

console.log('globalVar: ', globalVar);

exports.done = true;

console.log('b done');

　　最后创建 main.js，再加载 b 模块。

console.log('main starting');

const a = require('./a.js');    // 先导入a模块

const b = require('./b.js');    // 再导入b模块

console.log('在main模块中, a.done = %j, b.done = %j', a.done, b.done);

　　最终的打印顺序如下所示，在 main.js 中，先加载 a 模块，而在 a 模块中会尝试加载 b 模块。那么在进入到 b 模块后，为了防止无限死循环，会导出 a 模块已执行完成的部分。

main starting

a starting

b starting

在b模块中, a.done = false

globalVar:  全局变量

b done

在a模块中, b.done = true

a done

在main模块中, a.done = true, b.done = true

　　在上述示例中，还涉及到另一个问题，那就是在 a 模块中声明的 globalVar 变量，能在 b 模块中被成功打印。

　　在上文中也曾提到过模块封装器，那么 globalVar 变量的声明和打印，相当于下面这样，如果在函数内声明变量时省略 var 关键字，那么这个变量就会变成全局变量。

// a.js

(function (exports, require, module, __filename, __dirname) {

  globalVar = '全局变量';

});

// b.js

(function (exports, require, module, __filename, __dirname) {

  console.log(globalVar);

});

　　若要避免污染全局作用域，那么可以声明严格模式，禁止隐式的全局声明，如下所示。

'use strict';

globalVar = '全局变量';

5）与ECMAScript模块的差异

　　（1）import 语句只允许在 ES 模块中使用，但可以导入两种模块；而 CommonJS 的 require() 不能导入 ES 模块。

　　（2）ES 模块的 import 是异步执行的；而 CommonJS 模块的 require() 是同步执行的。

　　（3）ES 模块没有 __filename、__dirname、require.cache、module.exports 等变量。

　　（4）ES 模块是编译时输出，可以静态分析模块依赖；而 CommonJS 是运行时加载。

　　（5）ES 模块输出的是值引用；而 CommonJS 模块输出的是值副本。

　　需要通过一个示例来理解第五点差异，首先创建 lib.mjs 文件，.mjs 是 Node.js 为 ES 模块保留的后缀，在此类文件内可使用 export 和 import 语法。

　　在 lib.mjs 文件中，声明 digit 变量和 increase() 函数，在函数中对 digit 执行递增，通过 export 将它们导出。

// lib.mjs

export let digit = 0;

export function increase() {

  digit++;

}

　　在 main.mjs 文件中，加载 lib.mjs，打印 digit 变量，值为 0，调用 increase() 函数，再打印，值变为 1。由此可知，外部可以修改模块内部的值。

// main.mjs

import { digit, increase } from './lib.mjs';

console.log(digit);  // 0

increase();

console.log(digit);  // 1

　　接下来创建 lib.js 文件，同样是 digit 变量和 increase() 函数，通过 module.exports 将它们导出。

// lib.js

let digit = 0;

function increase() {

  digit++;

}

module.exports.digit = digit;

module.exports.increase = increase;

　　在 main.js 文件中，加载 lib.js，打印 digit 变量，值为 0，调用 increase() 函数，再打印，仍然是 0。由此可知，外部无法修改模块内部的值。

// main.js

const lib = require('./lib');

console.log(lib.digit);  // 0

lib.increase();

console.log(lib.digit);  // 0

　　（6）ES 模块不管是否遇到循环引用，其 import 导入的变量都会成为一个指向被加载模块的引用，而 CommonJS 模块遇到循环引用只会导出模块已执行完成的部分。

　　这其实也是两者加载机制的不同所导致的，参考第四点不同。

　　CommonJS 对循环引用的处理过程在上文中已介绍，现在改造之前官网的示例，在 main.mjs 中导入 a 和 b 两个模块，并打印 a 和 b 的值。

// main.mjs

import a from './a.mjs';

import b from './b.mjs';

console.log('在main模块中, a = %j, b = %j', a, b);

　　在 a.mjs 中，会导入 b.mjs，并打印 b 的值。而在 b.mjs 中，会导入 a.mjs，并打印 a 的值，如此就形成了循环引用。

// a.mjs

import b from './b.mjs';

let done = false;

export default done;

console.log('在a模块中, b = %j', b);

// b.mjs

import a from './a.mjs';

let done = false;

export default done;

console.log('在b模块中, a = %j', a);

　　运行 main.mjs，马上就会报错：ReferenceError: Cannot access 'a' before initialization。

　　在 main.mjs 中读取 a 的值时，会执行 a.mjs 并读取 b 的值，而在 b.mjs 中，默认会认为 a 已存在，但在访问的时候就会发现被欺骗，然后就报错了。

参考资料：

CommonJS模块

ECMAScript模块

使用 exports 从 Node.js 文件中公开功能

饿了么模块题目

为什么 Node.js 不给每一个.js文件以独立的上下文来避免作用域被污染?

Node.js技术栈

深入理解Node.js：核心思想与源码分析

Node.js 模块系统源码探微

Node.js VM 不完全指北

What’s the difference between CommonJS and ES6 modules?

ECMAScript6入门之ES6模块的循环加载

Node.js精进（1）——模块化的更多相关文章

Node.js中的模块化
每天一篇文章来记录记录自己的成长吧.大二,该静心了.加油~ 好了,废话不多说,今天说说nodejs中的模块化.(注:此文为自己对书nodejs实战的总结) nodejs一个重要的特性就是模块化,模块就 ...
Node.js学习（第一章：Node.js安装和模块化理解）
Node.js安装和简单使用安装方法简单的安装方式是直接官网下载,然后本地安装即可.官网地址:nodejs.org Windows系统下,选择和系统版本匹配的.msi后缀的安装文件.Mac OS ...
node.js - http、模块化、npm
今天是node学习的第二天,其实越往后面学越感觉有点熟悉的味道了,光针对于node来说哈,为什么呢,因为我之前学过一点云计算的东西,当时感觉没什么用搞了下服务器客户端这些,没想到这里还能用一用,至少看 ...
理解Node.js安装及模块化
1.安装Node Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境. Node.js 使用了一个事件驱动.非阻塞式 I/O 的模型,使其轻量又高效. Node.j ...
Node.js精进（2）——异步编程
虽然 Node.js 是单线程的,但是在融合了libuv后,使其有能力非常简单地就构建出高性能和可扩展的网络应用程序. 下图是 Node.js 的简单架构图,基于 V8 和 libuv,其中 Node ...
Node.js精进（3）——流
在 JavaScript 中,一般只处理字符串层面的数据,但是在 Node.js 中,需要处理网络.文件等二进制数据. 由此,引入了Buffer和Stream的概念,两者都是字节层面的操作. Buff ...
Node.js精进（4）——事件触发器
Events 是 Node.js 中最重要的核心模块之一,很多模块都是依赖其创建的,例如上一节分析的流,文件.网络等模块. 比较知名的 Express.KOA 等框架在其内部也使用了 Events 模 ...
Node.js精进（5）——HTTP
HTTP(HyperText Transfer Protocol)即超文本传输协议,是一种获取网络资源(例如图像.HTML文档)的应用层协议,它是互联网数据通信的基础,由请求和响应构成. 在 Node ...
Node.js精进（6）——文件
文件系统是一种用于向用户提供底层数据访问的机制,同时也是一套实现了数据的存储.分级组织.访问和获取等操作的抽象数据类型. Node.js 中的fs模块就是对文件系统的封装,整合了一套标准 POSIX ...

随机推荐

Java基础之浅谈继承、多态
一.继承的理解继承:简单通俗的来讲,继承就是一个类继承另一个类,通常用extends表示继承. 继承的类叫子类,被继承的类叫父类. 子类可以使用父类的变量和方法,同时也可以重写父类的方法. 在Jav ...
Python入门-初识变量类型
上一篇我们学习了第一行代码,我们print()了很多代码,我们可以print哪些东西呢,这一篇来讲. print()括号里面可以放哪些东西呢?..可以放很多东西,只要是Python的全部数据类型都可以 ...
基于Apache Hudi在Google云构建数据湖平台
自从计算机出现以来,我们一直在尝试寻找计算机存储一些信息的方法,存储在计算机上的信息(也称为数据)有多种形式,数据变得如此重要,以至于信息现在已成为触手可及的商品.多年来数据以多种方式存储在计算机中, ...
帝国cms发布文章对哪些数据表做了操作
帝国cms 发布一篇文章会影响哪些数据表 insert into phome_enewsfile_1(pubid,filename,filesize,adduser,path,filetime,cla ...
使用Harr特征的级联分类器实现目标检测
前言最近在学习人脸的目标检测任务时,用了Haar人脸检测算法,这个算法实现起来太简洁了,读入个.xml,调用函数就能用.但是深入了解我发现这个算法原理很复杂,也很优秀.究其根源,于是我找了好些篇相 ...
Spring Authorization Server授权服务器入门
11月8日Spring官方已经强烈建议使用Spring Authorization Server替换已经过时的Spring Security OAuth2.0,距离Spring Security OA ...
javaWeb代码整理01-mysql
jar包: maven坐标: <dependency> <groupId>mysql</groupId> <artifactId>mysql-conne ...
2021.12.19 eleveni的刷题记录
2021.12.19 eleveni的刷题记录 0. 本次记录有意思的题 0.1 每个点恰好经过一次并且求最小时间 P2469 [SDOI2010]星际竞速 https://www.luogu.com ...
进阶实战 css 点击按钮的样式
1. html结构 <div class="menu-wrap"> <input type="checkbox" class="t ...
A标签上使用onclick事件，js函数响应成功，单会刷新当前页面陷阱
BEGIN; 最近在做html页面时,有时候会遇到以前没遇到的各种奇葩问题. 目前要记载的,就是其中之一. 我们在写链接的时候,即A标签,最普通的写法无非是 <a href='http://ww ...

Node.js精进（1）——模块化

一、基础语法

二、CommonJS原理

Node.js精进（1）——模块化的更多相关文章

随机推荐

热门专题