跳到主要內容
黯羽輕揚每天積累一點點

Node.js 架構剖析

免費2020-04-26#Node#Nodejs C++ Bindings#Nodejs运行原理#Nodejs底层实现#Nodejs事件队列#Nodejs与libuv

每天都在用 Node.js,想過它是怎麼實現的嗎?

一. Node.js 締造的傳奇

I have a job now, and this guy is the reason why I have that now. His hobby project is what I use for living. Thanks. —— Shajan Jacob

2009 年 Ryan Dahl 在 JSConf EU 大會上推出了 Node.js,最初是希望能夠透過非同步模型突破傳統 Web 伺服器的高併發瓶頸,之後愈漸發展成熟,應用越來越廣,出現了繁榮的 Node.js 生態

借助 Node.js 走出瀏覽器之後,JavaScript 語言也 一發不可收拾

Any application that can be written in JavaScript, will eventually be written in JavaScript. —— Jeff Atwood

(摘自 The Principle of Least Power

早在 2017 年,NPM 就憑藉茫茫多的社群模組成為了 世界上最大的 package registry,目前模組數量已經 超過 125 萬,並且仍在快速增長中(每天新增 900 多個)

甚至 Node.js 工程師已經成為了一種新興職業,那麼,帶有傳奇色彩的 Node.js 本身是怎麼實現的呢?

二. Node.js 架構概覽

JS 程式碼跑在 V8 引擎上,Node.js 內建的 fshttp 等核心模組透過 C++ Bindings 呼叫 libuv、c-ares、llhttp 等 C/C++ 類別庫,從而接入作業系統提供的平台能力

其中,最重要的部分是 V8libuv

三. 原始碼相依性

V8

V8 is Google’s open source high-performance JavaScript and WebAssembly engine, written in C++. It is used in Chrome and in Node.js, among others.

一個用 C++ 寫的 JavaScript 引擎,由 Google 維護,用於 Chrome 瀏覽器和 Node.js

libuv

libuv is cross-platform support library which was originally written for Node.js. It’s designed around the event-driven asynchronous I/O model.

為 Node.js 量身打造,用 C 寫的跨平台非同步 I/O 庫,提供了非阻塞的檔案系統、DNS、網路、子程序、管道、訊號、輪詢和流式處理機制:

對於無法在作業系統層面非同步去做的工作,透過執行緒池來完成,如檔案 I/O、DNS 查詢等,具體原因見 Complexities in File I/O

P.S. 執行緒池的容量可以配置,預設是 4 個執行緒,具體見 Thread pool work scheduling

此外,Node.js 中的事件迴圈、事件佇列也都是由 libuv 提供的

Libuv provides the entire event loop functionality to NodeJS including the event queuing mechanism.

具體運作機制如下圖:

其它相依庫

另外,還相依一些 C/C++ 庫:

  • llhttp:用 TypeScript 和 C 寫的輕量級 HTTP 解析庫,比之前的 http_parser 快 1.5 倍,不含任何系統呼叫和記憶體分配(也不快取數據),因此每個請求的記憶體佔用極小

  • c-ares:一個 C 庫,用來處理非同步的 DNS 請求,對應 Node.js 中 dns 模組提供的 resolve() 系列方法

  • OpenSSL:一個通用的加密庫,多用於網路傳輸中的 TLS 和 SSL 協定實現,對應 Node.js 中的 tlscrypto 模組

  • zlib:提供快速壓縮和解壓支援

P.S. 關於 Node.js 原始碼相依性的更多資訊,見 Dependencies

四. 核心模組

像瀏覽器提供的 DOM/BOM API 一樣,Node.js 不僅提供了 JavaScript 執行環境,還擴充出了一系列平台 API,例如:

  • 檔案系統相關:對應 fs 模組

  • HTTP 通訊:對應 http 模組

  • 作業系統相關:對應 os 模組

  • 多程序:對應 child_processcluster 模組

這些內建模組稱為核心模組,為邁出瀏覽器世界的 JavaScript 長上了手腳

五. C++ Bindings

在核心模組之下,有一層 C++ Bindings,將上層的 JavaScript 程式碼與下層 C/C++ 類別庫橋接起來

底層模組為了更好的效能,採用 C/C++ 實現,而上層的 JavaScript 程式碼無法直接與 C/C++ 通訊,因而需要一個橋樑(即 Binding):

Bindings, as the name implies, are glue codes that “bind” one language with another so that they can talk with each other. In this case (Node.js), bindings simply expose core Node.js internal libraries written in C/C++ (c-ares, zlib, OpenSSL, llhttp, etc.) to JavaScript.

另一方面,透過 Bindings 也可以複用可靠的老牌開源類別庫,而不必手搓所有底層模組

以檔案 I/O 為例,讀取當前 JS 檔案內容並輸出到標準輸出:

// readThisFile.js
const fs = require('fs')
const path = require('path')
const filePath = path.resolve(__filename);

// Parses the buffer into a string
function callback (data) {
  return data.toString()
}

// Transforms the function into a promise
const readFileAsync = (filePath) => {
  return new Promise((resolve, reject) => {
    fs.readFile(filePath, (err, data) => {
      if (err) return reject(err)
      return resolve(callback(data))
    })
  })
}

(() => {
  readFileAsync(filePath)
    .then(console.log)
    .catch(console.error)
})()

然而,其中用到的 fs.readFile 介面既不是 V8 提供的,也不是 JS 自帶的,而是由 Node.js 以 C++ Binding 的形式藉助 libuv 實現的:

// https://github.com/nodejs/node/blob/v14.0.0/lib/fs.js#L58
const binding = internalBinding('fs');
// https://github.com/nodejs/node/blob/v14.0.0/lib/fs.js#L71
const { FSReqCallback, statValues } = binding;

// https://github.com/nodejs/node/blob/v14.0.0/lib/fs.js#L297
function readFile(path, options, callback) {
  callback = maybeCallback(callback || options);
  options = getOptions(options, { flag: 'r' });
  if (!ReadFileContext)
    ReadFileContext = require('internal/fs/read_file_context');
  const context = new ReadFileContext(callback, options.encoding);
  context.isUserFd = isFd(path); // File descriptor ownership

  const req = new FSReqCallback();
  req.context = context;
  req.oncomplete = readFileAfterOpen;

  if (context.isUserFd) {
    process.nextTick(function tick() {
      req.oncomplete(null, path);
    });
    return;
  }

  path = getValidatedPath(path);
  const flagsNumber = stringToFlags(options.flags);
  binding.open(pathModule.toNamespacedPath(path),
              flagsNumber,
              0o666,
              req);
}

最後的 binding.open 是一個 C++ 呼叫,用來打開檔案描述符,三個參數分別是檔案路徑, C++ fopen 的檔案存取模式字串(如 rw+),以及八進位格式的檔案讀寫權限(666 表示每個人都有讀寫權限),和接收返回數據的 req 回調

其中, internalBinding 是個 C++ binding loader, internalBinding('fs') 實際載入的 C++ 程式碼位於 node/src/node_file.cc

至此,關鍵的部分差不多都清楚了,那麼,一段 Node.js 程式碼究竟是怎樣運行的呢?

六. 執行原理

首先,編寫的 JavaScript 程式碼由 V8 引擎來執行,執行中註冊的事件監聽會被保留下來,在對應的事件發生時收到通知

網路、檔案 I/O 等事件產生時,已註冊的回調函數將排到事件佇列中,接著被事件迴圈取出放到呼叫堆疊上,回調函數執行完(呼叫堆疊清空)之後,事件迴圈再取一個放上去……

執行過程中遇到 I/O 操作就交給 libuv 執行緒池中的某個 woker 來處理,結束之後 libuv 產生一個事件放入事件佇列。事件迴圈處理到返回事件時,對應的回調函數才在主執行緒開始執行,主執行緒在此期間繼續其它工作,而不阻塞等待

Node.js 就像一家咖啡館,店裡只有一個跑堂的(主執行緒),一大堆顧客湧過來的時候,會排隊等候(進入事件佇列),到號的顧客訂單會被傳給經理(libuv),經理將訂單分配給咖啡師(worker 執行緒),咖啡師用不同的原料和工具(底層相依的 C/C++ 模組)來製作訂單要求的各種咖啡,一般會有 4 個咖啡師值班,高峰時候可能會增加一些。訂單傳給經理後,不等咖啡做出來,而是接著處理下一個訂單。一杯咖啡做完之後,放到出餐流水線(IO Events 佇列),送達前台後,跑堂的喊名字,顧客過來取

參考資料

評論

暫無評論,快來發表你的看法吧

提交評論