node系列4

进程管理

NodeJS可以感知和控制自身进程的运行环境和状态，也可以创建子进程并与其协同工作，这使得NodeJS可以把多个程序组合在一起共同完成某项工作，并在其中充当胶水和调度器的作用。本章除了介绍与之相关的NodeJS内置模块外，还会重点介绍典型的使用场景

开门红

如何使用NodeJS调用终端命令来简化目录拷贝

var child_process = require('child_process');

var util = require('util');

function copy(source, target, callback) {

    child_process.exec(

        util.format('cp -r %s/* %s', source, target), callback);

}

copy('a', 'b', function (err) {

    // ...

});

从以上代码中可以看到，子进程是异步运行的，通过回调函数返回执行结果

API走马观花

NodeJS提供了哪些和进程管理有关的API

Process

任何一个进程都有启动进程时使用的命令行参数，有标准输入标准输出，有运行权限，有运行环境和运行状态。在NodeJS中，可以通过process对象感知和控制NodeJS自身进程的方方面面。另外需要注意的是，process不是内置模块，而是一个全局对象，因此在任何地方都可以直接使用

Child Process

使用child_process模块可以创建和控制子进程。该模块提供的API中最核心的是.spawn，其余API都是针对特定使用场景对它的进一步封装，算是一种语法糖

Cluster

cluster模块是对child_process模块的进一步封装，专用于解决单进程NodeJS Web服务器无法充分利用多核CPU的问题。使用该模块可以简化多进程服务器程序的开发，让每个核上运行一个工作进程，并统一通过主进程监听端口和分发请求

应用场景

和进程管理相关的API单独介绍起来比较枯燥，因此这里从一些典型的应用场景出发，分别介绍一些重要API的使用方法

如何获取命令行参数

在NodeJS中可以通过process.argv获取命令行参数。但是比较意外的是，node执行程序路径和主模块文件路径固定占据了argv[0]和argv[1]两个位置，而第一个命令行参数从argv[2]开始。为了让argv使用起来更加自然，可以按照以下方式处理

function main(argv) {

    // ...

}

main(process.argv.slice(2));

如何退出程序

通常一个程序做完所有事情后就正常退出了，这时程序的退出状态码为0。或者一个程序运行时发生了异常后就挂了，这时程序的退出状态码不等于0。如果我们在代码中捕获了某个异常，但是觉得程序不应该继续运行下去，需要立即退出，并且需要把退出状态码设置为指定数字，比如1，就可以按照以下方式

try {

    // ...

} catch (err) {

    // ...

    process.exit(1);

}

如何控制输入输出

NodeJS程序的标准输入流（stdin）、一个标准输出流（stdout）、一个标准错误流（stderr）分别对应process.stdin、process.stdout和process.stderr，第一个是只读数据流，后边两个是只写数据流，对它们的操作按照对数据流的操作方式即可。例如，console.log可以按照以下方式实现

function log() {

    process.stdout.write(

        util.format.apply(util, arguments) + '\n');

}

如何降权

在Linux系统下，我们知道需要使用root权限才能监听1024以下端口。但是一旦完成端口监听后，继续让程序运行在root权限下存在安全隐患，因此最好能把权限降下来。以下是这样一个例子

http.createServer(callback).listen(80, function () {

    var env = process.env,

        uid = parseInt(env['SUDO_UID'] || process.getuid(), 10),

        gid = parseInt(env['SUDO_GID'] || process.getgid(), 10);

    process.setgid(gid);

    process.setuid(uid);

});

上例中有几点需要注意：

如果是通过sudo获取root权限的，运行程序的用户的UID和GID保存在环境变量SUDO_UID和SUDO_GID里边。如果是通过chmod +s方式获取root权限的，运行程序的用户的UID和GID可直接通过process.getuid和process.getgid方法获取
process.setuid和process.setgid方法只接受number类型的参数
降权时必须先降GID再降UID，否则顺序反过来的话就没权限更改程序的GID了

如何创建子进程

以下是一个创建NodeJS子进程的例子

var child = child_process.spawn('node', [ 'xxx.js' ]);

child.stdout.on('data', function (data) {

    console.log('stdout: ' + data);

});

child.stderr.on('data', function (data) {

    console.log('stderr: ' + data);

});

child.on('close', function (code) {

    console.log('child process exited with code ' + code);

});

上例中使用了.spawn(exec, args, options)方法，该方法支持三个参数。第一个参数是执行文件路径，可以是执行文件的相对或绝对路径，也可以是根据PATH环境变量能找到的执行文件名。第二个参数中，数组中的每个成员都按顺序对应一个命令行参数。第三个参数可选，用于配置子进程的执行环境与行为

另外，上例中虽然通过子进程对象的.stdout和.stderr访问子进程的输出，但通过options.stdio字段的不同配置，可以将子进程的输入输出重定向到任何数据流上，或者让子进程共享父进程的标准输入输出流，或者直接忽略子进程的输入输出

进程间如何通讯

在Linux系统下，进程之间可以通过信号互相通信。以下是一个例子

/* parent.js */

var child = child_process.spawn('node', [ 'child.js' ]);

child.kill('SIGTERM');

/* child.js */

process.on('SIGTERM', function () {

    cleanUp();

    process.exit(0);

});

在上例中，父进程通过.kill方法向子进程发送SIGTERM信号，子进程监听process对象的SIGTERM事件响应信号。不要被.kill方法的名称迷惑了，该方法本质上是用来给进程发送信号的，进程收到信号后具体要做啥，完全取决于信号的种类和进程自身的代码

另外，如果父子进程都是NodeJS进程，就可以通过IPC（进程间通讯）双向传递数据。以下是一个例子

/* parent.js */

var child = child_process.spawn('node', [ 'child.js' ], {

        stdio: [ 0, 1, 2, 'ipc' ]

    });

child.on('message', function (msg) {

    console.log(msg);

});

child.send({ hello: 'hello' });

/* child.js */

process.on('message', function (msg) {

    msg.hello = msg.hello.toUpperCase();

    process.send(msg);

});

可以看到，父进程在创建子进程时，在options.stdio字段中通过ipc开启了一条IPC通道，之后就可以监听子进程对象的message事件接收来自子进程的消息，并通过.send方法给子进程发送消息。在子进程这边，可以在process对象上监听message事件接收来自父进程的消息，并通过.send方法向父进程发送消息。数据在传递过程中，会先在发送端使用JSON.stringify方法序列化，再在接收端使用JSON.parse方法反序列化

如何守护子进程

守护进程一般用于监控工作进程的运行状态，在工作进程不正常退出时重启工作进程，保障工作进程不间断运行。以下是一种实现方式

/* daemon.js */

function spawn(mainModule) {

    var worker = child_process.spawn('node', [ mainModule ]);

    worker.on('exit', function (code) {

        if (code !== 0) {

            spawn(mainModule);

        }

    });

}

spawn('worker.js');

异步编程

NodeJS最大的卖点——事件机制和异步IO，没有掌握异步编程就不能说是真正学会了NodeJS。

回调

在代码中，异步编程的直接体现就是回调。异步编程依托于回调来实现，但不能说使用了回调后程序就异步化了

function heavyCompute(n, callback) {

    var count = 0,

        i, j;

    for (i = n; i > 0; --i) {

        for (j = n; j > 0; --j) {

            count += 1;

        }

    }

    callback(count);

}

heavyCompute(10000, function (count) {

    console.log(count);

});

console.log('hello');

-- Console ------------------------------

100000000

hello

以上代码中的回调函数仍然先于后续代码执行。JS本身是单线程运行的，不可能在一段代码还未结束运行时去运行别的代码，因此也就不存在异步执行的概念

但是，如果某个函数做的事情是创建一个别的线程或进程，并与JS主线程并行地做一些事情，并在事情做完后通知JS主线程，那情况又不一样了。我们接着看看以下代码

setTimeout(function () {

    console.log('world');

}, 1000);

console.log('hello');

-- Console ------------------------------

hello

world

这次可以看到，回调函数后于后续代码执行了。如同上边所说，JS本身是单线程的，无法异步执行，因此我们可以认为setTimeout这类JS规范之外的由运行环境提供的特殊函数做的事情是创建一个平行线程后立即返回，让JS主进程可以接着执行后续代码，并在收到平行进程的通知后再执行回调函数。除了setTimeout、setInterval这些常见的，这类函数还包括NodeJS提供的诸如fs.readFile之类的异步API

另外，我们仍然回到JS是单线程运行的这个事实上，这决定了JS在执行完一段代码之前无法执行包括回调函数在内的别的代码。也就是说，即使平行线程完成工作了，通知JS主线程执行回调函数了，回调函数也要等到JS主线程空闲时才能开始执行。以下就是这么一个例子

function heavyCompute(n) {

    var count = 0,

        i, j;

    for (i = n; i > 0; --i) {

        for (j = n; j > 0; --j) {

            count += 1;

        }

    }

}

var t = new Date();

setTimeout(function () {

    console.log(new Date() - t);

}, 1000);

heavyCompute(50000);

-- Console ------------------------------

8520

本来应该在1秒后被调用的回调函数因为JS主线程忙于运行其它代码，实际执行时间被大幅延迟

代码设计模式

异步编程有很多特有的代码设计模式，为了实现同样的功能，使用同步方式和异步方式编写的代码会有很大差异

函数返回值

使用一个函数的输出作为另一个函数的输入是很常见的需求，在同步方式下一般按以下方式编写代码

var output = fn1(fn2('input'));

// Do something.

在异步方式下，由于函数执行结果不是通过返回值，而是通过回调函数传递，因此一般按以下方式编写代码

fn2('input', function (output2) {

    fn1(output2, function (output1) {

        // Do something.

    });

});

这种方式就是一个回调函数套一个回调函多，套得太多了很容易写出>形状的代码

遍历数组

var len = arr.length,

    i = 0;

for (; i < len; ++i) {

    arr[i] = sync(arr[i]);

}

// All array items have processed.

如果函数是异步执行的，以上代码就无法保证循环结束后所有数组成员都处理完毕了。如果数组成员必须一个接一个串行处理，则一般按照以下方式编写异步代码

(function next(i, len, callback) {

    if (i < len) {

        async(arr[i], function (value) {

            arr[i] = value;

            next(i + 1, len, callback);

        });

    } else {

        callback();

    }

}(0, arr.length, function () {

    // All array items have processed.

}));

以上代码在异步函数执行一次并返回执行结果后才传入下一个数组成员并开始下一轮执行，直到所有数组成员处理完毕后，通过回调的方式触发后续代码的执行

如果数组成员可以并行处理，但后续代码仍然需要所有数组成员处理完毕后才能执行的话，则异步代码会调整成以下形式

(function (i, len, count, callback) {

    for (; i < len; ++i) {

        (function (i) {

            async(arr[i], function (value) {

                arr[i] = value;

                if (++count === len) {

                    callback();

                }

            });

        }(i));

    }

}(0, arr.length, 0, function () {

    // All array items have processed.

}));

与异步串行遍历的版本相比，以上代码并行处理所有数组成员，并通过计数器变量来判断什么时候所有数组成员都处理完毕了

异常处理

node系列4的更多相关文章

深入理解Node系列-细说Connect(上)
前言想必对于广大前后端的同学们,Node 或是用来作为网站服务器的搭建,亦或是用来作为开发脚手架的运用,或是早有套路,亦或是浅尝辄止.从现在开始博主将会不定时的对 Node 系列的产品做分析,其中夹 ...
node系列1
NodeJS基础 JS是脚本语言,脚本语言都需要一个解析器才能运行,NodeJS就是一个解析器.nodejs.org 打开终端,键入node进入命令交互模式,可以输入一条代码语句后立即执行并显示结果 ...
node系列：琐碎备忘
cmd 全局与本地路径查看:默认查看本地路径:npm config get cache,默认和nodejs安装目录同一目录查看全局路径:npm config get prefix,默认c盘app ...
每天几分钟跟小猫学前端之node系列：用node实现最简单的爬虫
先来段求分小视频: https://www.iesdouyin.com/share/video/6550631947750608142/?region=CN&mid=6550632036246 ...
node系列：全局与本地
查看:默认和当前的全局与本地全局路径:npm config get prefix 本地路径:npm config get cache 修改修改就会创建对应目录(文件夹) 修改本地路径:npm c ...
带你学Node系列之express-CRUD
前言 hello,小伙伴们,我是你们的pubdreamcc,本篇博文出至于我的GitHub仓库node学习教程资料,欢迎小伙伴们点赞和star,你们的点赞是我持续更新的动力. GitHub仓库地址:n ...
每天学点node系列-stream
在编写代码时,我们应该有一些方法将程序像连接水管一样连接起来 -- 当我们需要获取一些数据时,可以去通过"拧"其他的部分来达到目的.这也应该是IO应有的方式. -- Doug Mc ...
每天学点node系列-http
任何可以使用JavaScript来编写的应用,最终会由JavaScript编写.--Atwood's Law http模块概览 http模块主要用于创建http server服务,并且支持更多特性 ...
每天学点node系列-fs文件系统
好的代码像粥一样,都是用时间熬出来的. 概述文件 I/O 是由简单封装的标准 POSIX 函数提供的. 通过 require('fs') 使用该模块. 所有文件系统操作都具有同步和异步的形式. 异步 ...

随机推荐

bottle + vue.js 打造你的单页应用
看到各种单页应用之后,觉得单页应用简直酷毙了,作为一个技术宅,在假期的时候恶补了一下vue ,觉得还不错,不过想想前端的东西毕竟还是太广博了.我也不知道怎么写反正应用起来有点别扭,就是资料太少了,成 ...
python函数的返回值讲解
我们一起来聊聊python函数返回值的特殊情况,之前我也碰到过类似方面的问题,到后来查阅了一些资料后,发现原来是这样. 首先,写函数的时候,一定要写函数的文档,这样方便我们识别函数是做什么的.我记得很 ...
EventLog组件
1.使用EventLog组件读写事件日志 SourceExists方法确定事件源是否已在本地计算机上注册 DeleteEventSource方法用于从事件日志中移除应用程序的事件源注册 pri ...
一步步学习NHibernate(2)——配置NHibernate的环境
请注明转载地址:http://www.cnblogs.com/arhat 第二章环境搭建在上一章中,我们知道了NHibernate是用来干什么的了,那么今天在本章中,我们开始搭建NHibernat ...
ctf总结
在过去的一个学期中,草人在西普学院还有一些其他安全夺旗网站上刷了一些题,草人我是菜鸟一个,刚开始很是苦恼,所以经历过以后希望将之分享给一起学习安全的同学,目的呢是希望以后学习的人能尽快理清学习思路,进 ...
mysql基本内容学习过程
mysql数据库的基本操作: , 数据库的登录:mysql -u 用户名(root) -p密码 -P (端口) -h服务器名(本地表示:127.0.0.1) . 更改数据库显示:mysql -u ro ...
【弱省胡策】Round #6 String 解题报告
感觉这个题好神啊. 首先我们只管 $a = b$ 的情况,那么我们自然就可以把这个串对 $a$ 取模,然后用 KMP 求出能弄出几个其他的 B 串. 具体就是把串先倍长,然后倒过来,然后求 $Next ...
Burp Suite Walkthrough(英文版)
Burp Suite is one of the best tools available for web application testing. Its wide variety of featu ...
hdu 3715
一个很简单的2-sat的题: 不过比较难想到: 其实也不是很难,可能接触的少了吧! #include<cstdio> #include<vector> #define maxn ...
FZU 2150 Fire Game（BFS）
点我看题目题意 :就是有两个熊孩子要把一个正方形上的草都给烧掉,他俩同时放火烧,烧第一块的时候是不花时间的,每一块着火的都可以在下一秒烧向上下左右四块#代表草地,.代表着不能烧的.问你最少花多少时间 ...