Node8中AsyncHooks异步生命周期

Async Hooks 是 Node8 新出来的特性,提供了一些 API 用于跟踪 NodeJs 中的异步资源的生命周期,属于 NodeJs 内置模块,可以直接引用。

const async_hooks = require('async_hooks');

这是一个很少使用的模块,为什么会有这个模块呢?

我们都知道,JavaScript在设计之初就是一门单线程语言,这和他的设计初衷有关,最初的JavaScript仅仅是用来进行页面的表单校验,在低网速时代降低用户等待服务器响应的时间成本。随着Web前端技术的发展,虽然前端功能越来越强大,越来越被重视,但是单线程似乎也没有什么解决不了的问题,相比较而言多线程似乎更加的复杂,所以单线程依旧被沿用至今。

既然JavaScript是单线程,但是在日常开发中总是会有一些比较耗时的任务,比如说定时器,再比如说如今已经标准化的Ajax,JavaScript为了解决这些问题,将自身分为了BOM,DOM,ECMAScript,BOM会帮我们解决这些耗时的任务,称之为异步任务。

正因为浏览器的BOM帮我们处理了异步任务,所以大部分的程序员对异步任务除了会用几乎一无所知,比如同时有多少异步任务在队列中?异步是否拥堵等,我们都是没有办法直接获得相关信息的,很多情况下,底层确实也不需要我们关注相关的信息,但如果我们在某些情况下想要相关信息的时候,NodeJS提供了一个Experimental的API供我们使用,也就是async_hooks。为什么是NodeJS呢,因为只有在Node中定时器,http这些异步模块,才是开发者可以控制的,浏览器中的BOM是不被开发者控制的,除非浏览器提供对应的API。

async_hooks规则

async_hooks约定每一个函数都会提供一个上下文,我们称之为async scope,每一个async scope中都有一个 asyncId, 是当前async scope的标志,同一个的async scope中asyncId必然相同。

这在多个异步任务并行的时候,asyncId可以使我们可以很好的区分要监听的是哪一个异步任务。

asyncId是一个自增的不重复的正整数,程序的第一个asyncId必然是1。

async scope通俗点来说就是一个不能中断的同步任务,只要是不能中断的,无论多长的代码都共用一个asyncId,但如果中间是可以中断的,比如是回调,比如中间有await,都会创建一个新的异步上下文,也会有一个新的asyncId。

每一个async scope中都有一个triggerAsyncId表示当前函数是由那个async scope触发生成的;

通过 asyncId 和 triggerAsyncId 我们可以很方便的追踪整个异步的调用关系及链路。

async_hooks.executionAsyncId()用于获取asyncId,可以看到全局的asyncId是1。

async_hooks.triggerAsyncId()用于获取triggerAsyncId,目前值为0。

const async_hooks = require('async_hooks');
console.log('asyncId:', async_hooks.executionAsyncId()); // asyncId: 1
console.log('triggerAsyncId:', async_hooks.triggerAsyncId()); // triggerAsyncId: 0

我们这里使用fs.open打开一个文件,可以发现fs.open的asyncId是7,而fs.open的triggerAsyncId变成了1,这是因为fs.open是由全局调用触发的,全局的asyncId是1。

const async_hooks = require('async_hooks');
console.log('asyncId:', async_hooks.executionAsyncId()); // asyncId: 1
console.log('triggerAsyncId:', async_hooks.triggerAsyncId()); // triggerAsyncId: 0
const fs = require('fs');
fs.open('./test.js', 'r', (err, fd) => {
    console.log('fs.open.asyncId:', async_hooks.executionAsyncId()); // 7
    console.log('fs.open.triggerAsyncId:', async_hooks.triggerAsyncId()); // 1
});

异步函数的生命周期

当然实际应用中的async_hooks并不是这样使用的,他正确的用法是在所有异步任务创建、执行前、执行后、销毁后,触发回调,所有回调会传入asyncId。

我们可以使用async_hooks.createHook来创建一个异步资源的钩子,这个钩子接收一个对象作为参数来注册一些关于异步资源生命周期中可能发生事件的回调函数。每当异步资源被创建/执行/销毁时这些钩子函数会被触发。

const async_hooks = require('async_hooks');

const asyncHook = async_hooks.createHook({
  init(asyncId, type, triggerAsyncId, resource) { },
  destroy(asyncId) { }
})

目前 createHook 函数可以接受五类 Hook Callbacks 如下:

1.init(asyncId, type, triggerAsyncId, resource)

  • init 回调函数一般在异步资源初始化的时候被触发。
  • asyncId: 每一个异步资源都会生成一个唯一性标志
  • type: 异步资源的类型,一般都是资源的构造函数的名字。

FSEVENTWRAP, FSREQCALLBACK, GETADDRINFOREQWRAP, GETNAMEINFOREQWRAP, HTTPINCOMINGMESSAGE,
HTTPCLIENTREQUEST, JSSTREAM, PIPECONNECTWRAP, PIPEWRAP, PROCESSWRAP, QUERYWRAP,
SHUTDOWNWRAP, SIGNALWRAP, STATWATCHER, TCPCONNECTWRAP, TCPSERVERWRAP, TCPWRAP,
TTYWRAP, UDPSENDWRAP, UDPWRAP, WRITEWRAP, ZLIB, SSLCONNECTION, PBKDF2REQUEST,
RANDOMBYTESREQUEST, TLSWRAP, Microtask, Timeout, Immediate, TickObject

  • triggerAsyncId: 表示触发当前异步资源被创建的对应的 async scope 的 asyncId
  • resource: 代表被初始化的异步资源对象

我们可以通过 async_hooks.createHook 函数来注册关于每个异步资源在生命周期中发生的 init/before/after/destory/promiseResolve 等相关事件的监听函数;
同一个 async scope 可能会被调用及执行多次,不管执行多少次,其 asyncId 必然相同,通过监听函数,我们很方便追踪其执行的次数及时间及上线文关系;

2.before(asyncId)

before函数一般在 asyncId 对应的异步资源操作完成后准备执行回调前被调用,before回调函数可能被执行多次,由其被回调的次数来决定,使用时这里需要注意。

3.after(asyncId)

after回调函数一般在异步资源执行完回调函数后会立即被调用,如果在执行回调函数的过程中发生未捕获的异常,after 事件会在触发 “uncaughtException” 事件后被调用。

4.destroy(asyncId)

当asyncId对应的异步资源被销毁时调用,有些异步资源的销毁要依赖垃圾回收机制,所以有些情况下由于内存泄漏的原因,destory事件可能永远不会被触发。

5.promiseResolve(asyncId)

当 Promise 构造器中的 resovle 函数被执行时,promiseResolve 事件被触发。有些情况下,有些 resolve 函数是被隐式执行的,比如 .then 函数会返回一个新的 Promise,这个时候也会被调用。

const async_hooks = require('async_hooks');

// 获取当前执行上下文的 asyncId
const eid = async_hooks.executionAsyncId();

// 获取触发当前函数的 asyncId
const tid = async_hooks.triggerAsyncId();

// 创建新的AsyncHook实例。所有这些回调都是可选的
const asyncHook =
    async_hooks.createHook({ init, before, after, destroy, promiseResolve });

// 需要显示声明 才能执行
asyncHook.enable();

// 禁止监听新的异步事件。
asyncHook.disable();

function init(asyncId, type, triggerAsyncId, resource) { }

function before(asyncId) { }

function after(asyncId) { }

function destroy(asyncId) { }

function promiseResolve(asyncId) { }

Promise

promise是比较特殊的一种情况,如果足够细心init方法中的type中你就会发现其中并没有PROMISE。如果仅使用ah.executionAsyncId()来获取Promise的的asyncId的话,是不能取得正确的ID的,只有在添加了实际的hook只后,async_hooks才会给Promise的回调创建asyncId。

换句话说,由于V8对于获取 asyncId 的执行成本比较高,所以默认情况下,我们是不给 Promise 分配新的 asyncId。
也就是说默认情况下,我们使用promises或者 async/await 时是获取不到当前上下文正确的asyncId和triggerId。不过没关系,我们可以通过执行async_hooks.createHook(callbacks).enable()函数强制开启对Promise分配asyncId。

const async_hooks = require('async_hooks');

const asyncHook = async_hooks.createHook({
  init(asyncId, type, triggerAsyncId, resource) { },
  destroy(asyncId) { }
})
asyncHook.enable();

Promise.resolve(123).then(() => {
  console.log(`asyncId ${async_hooks.executionAsyncId()} triggerId ${async_hooks.triggerAsyncId()}`);
});

另外Promise只会触发init和promiseResolve钩子事件函数,而before和after事件的钩子函数只会在Promise的链式调用时被触发,也就是说只有在.then/.catch函数中生成的Promise时才会被触发。

new Promise(resolve => {
    resolve(123);
}).then(data => {
    console.log(data);
})

可以发现,上面的存在两个Promise,第一个是new实例化创建的,第二个是then创建的(不明白的可以查看之前的Promise源码文章)。

这里的顺序是执行new Promise的时候会调用自身的init函数,然后在执行resolve的时候调用promiseResolve函数。接着在then方法中执行第二个Promise的init函数,然后执行第二个Promise的before,promiseResovle,after函数。

异常处理

如果注册的async-hook回调函数中发生异常,那么服务将打印错误日志并立即退出,同时所有de 监听器将被移除,同时会触发 ‘exit' 事件退出程序。

之所以会立即退出进程,是因为如果这些async-hook 函数运行不稳定,下一个相同事件被触发时很可能又抛出异常,这些函数主要就是为了监听异步事件的,如果不稳定应该及时发现并进行更正。

在异步钩子回调中打印日志

由于 console.log 函数也是一个异步调用,如果我们在 async-hook 函数中再调用 console.log 那么将再次触发相应的 hook 事件,造成死循环调用,所以我们在 async-hook 函数中必须使用同步打印日志方式来跟踪,可以使用 fs.writeSync 函数:

const fs = require('fs');
const util = require('util');

function debug(...args) {
  fs.writeFileSync('log.out', `${util.format(...args)}\n`, { flag: 'a' });
}

[参考文献-AsyncHooks] (https://nodejs.org/dist/latest-v15.x/docs/api/async_hooks.html)

到此这篇关于Node8中AsyncHooks异步生命周期的文章就介绍到这了,更多相关Node AsyncHooks异步生命周期内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • node.js利用express自动搭建项目的全过程

    一.安装express库和生成器 打开cmd输入命令:  yarn global add express express-generator 解释: 上面里两个模块分别表示库和生成器,在express3时,安装express会自动的给你安装生成器express-generator ,但是在express4时,他们就被分开了,所以需要分别安装. 安装好后可以通过命令:express --version 检查是否安装成功. 出现版本号即为安装成功(如下图所示). 二.express生成器自动创建ex

  • node.js 全局变量的具体使用

    全局对象 所有模块都可以调用 global:表示Node所在的全局环境,类似于浏览器中的window对象. process:指向Node内置的process模块,允许开发者与当前进程互动. 例如你在DOS或终端窗口直接输入node,就会进入NODE的命令行方式(REPL环境).退出要退出的话,可以输入 process.exit(); console:指向Node内置的console模块,提供命令行环境中的标准输入.标准输出功能. 全局函数 定时器函数:共有4个,分别是setTimeout(),

  • 搞懂什么是Node.js原来这么简单

    Node.js 的官方介绍 在 Node.js 的官方网站的首页中,有这样一句话来描述 Node.js: Node.js® is a JavaScript runtime built on Chrome's V8 JavaScript engine. Node.js uses an event-driven, non-blocking I/O model that makes it lightweight and efficient. 翻译过来的意思就是: Node.js 是基于 Chrome

  • Nodejs探秘之深入理解单线程实现高并发原理

    前言 从Node.js进入我们的视野时,我们所知道的它就由这些关键字组成 事件驱动.非阻塞I/O.高效.轻量,它在官网中也是这么描述自己的. Node.js® is a JavaScript runtime built on Chrome's V8 JavaScript engine. Node.js uses an event-driven, non-blocking I/O model that makes it lightweight and efficient. 于是在我们刚接触Node

  • 比较node.js和Deno

    前言 如果你一直关注 Web 开发领域,那么最近可能已经听到了很多关于 Deno 的信息--一种新的JavaScript运行时,它可能也会被认为是 Node.js的继承者.但是这意味着什么,我们需要"下一个 Node.js" 吗? 什么是 Deno? 要了解发生了什么,我们首先需要看一下 Deno 到底是什么.就像我前面说过的那样,这是一个新的JavaScript运行时,也就是要执行 JS代码的环境.它最初是由Ryan Dahl创造的,他在之前曾经为我们把 Deno 与Node.js进

  • nodejs处理tcp连接的核心流程

    前几天和一个小伙伴交流了一下nodejs中epoll和处理请求的一些知识,今天简单来聊一下nodejs处理请求的逻辑.我们从listen函数开始. int uv_tcp_listen(uv_tcp_t* tcp, int backlog, uv_connection_cb cb) { // 设置处理的请求的策略,见下面的分析 if (single_accept == -1) { const char* val = getenv("UV_TCP_SINGLE_ACCEPT"); sing

  • Nodejs 数组的队列以及forEach的应用详解

    本文主要记录了在Nodejs开发过程中遇到过的由数组特性引起的问题及解决方式,以及对数组的灵活应用. 本文代码测试结果均基于node v6.9.5 数组与队列 利用数组对象方法push/shift可实现队列先进先出特性,例如: >a=[] [] >a.push(2.3.4) 3 >a.push(2) 3 >a [2.3.4.2] >a.shift() 2 >a >[3.4.2] 数组与forEach 对数组的删除操作有两种常见方式:delete和使用splice方

  • nodejs的错误处理过程记录

    本文以连接错误ECONNREFUSED为例,看看nodejs对错误处理的过程. 假设我们有以下代码 1. const net = require('net'); 2. net.connect({port: 9999}) 如果本机上没有监听9999端口,那么我们会得到以下输出. 1. events.js:170 2. throw er; // Unhandled 'error' event 3. ^ 4. 5. Error: connect ECONNREFUSED 127.0.0.1:9999

  • node中使用shell脚本的方法步骤

    背景 在开发中我们在特定的场合下可能需要一些脚本来批量处理我们的业务逻辑,在nodejs如何调用shell脚本呢? 新建 项目下新建脚本文件 touch newFile.sh 修改文件权限 chmod 777 newFile.sh 修改文件为可读可写可执行 nodejs调用 文件读取 //使用nodejs的子进程里面的文件读取方法 const { execFile } = require('child_process'); 示例 DocsService.publishAllDocs = (req

  • Node.js之http模块的用法

    前言 Node.js开发的目的就是为了用JavaScript编写Web服务器程序.因为JavaScript实际上已经统治了浏览器端的脚本,其优势就是有世界上数量最多的前端开发人员.如果已经掌握了JavaScript前端开发,再学习一下如何将JavaScript应用在后端开发,就是名副其实的全栈了. HTTP协议 要理解Web服务器程序的工作原理,首先,我们要对HTTP协议有基本的了解.如果你对HTTP协议不太熟悉,先看一看HTTP协议简介. HTTP服务器 要开发HTTP服务器程序,从头处理TC

随机推荐