Cluster

最后更新于:2022-04-01 01:58:17

### 稳定度: 2 - 稳定 单个的`io.js`实例运行在单线程上。为了享受多核系统的优势,用户需要启动一个`io.js`集群来处理负载。 `cluster`模块允许你方便地创建共享服务器端口的子进程: ~~~ var cluster = require('cluster'); var http = require('http'); var numCPUs = require('os').cpus().length; if (cluster.isMaster) { // Fork workers. for (var i = 0; i < numCPUs; i++) { cluster.fork(); } cluster.on('exit', function(worker, code, signal) { console.log('worker ' + worker.process.pid + ' died'); }); } else { // Workers can share any TCP connection // In this case its a HTTP server http.createServer(function(req, res) { res.writeHead(200); res.end("hello world\n"); }).listen(8000); } ~~~ 启动`io.js`将会在工作线程中共享8000端口: ~~~ % NODE_DEBUG=cluster iojs server.js 23521,Master Worker 23524 online 23521,Master Worker 23526 online 23521,Master Worker 23523 online 23521,Master Worker 23528 online ~~~ 这个特性是最近才开发的,并且可能在未来有所改变。请试用它并提供反馈。 注意,在Windows中,在工作进程中建立命名管道服务器目前是不可行的。 #### 工作原理 工作进程通过`child_process.fork`方法被创建,所以它们可以与父进程通过IPC管道沟通以及相互传递服务器句柄。 集群模式支持两种分配传入连接的方式。 第一种(并且是除了Windows平台外默认的方式)是循环式。主进程监听一个端口,接受新连接,并且以轮流的方式分配给工作进程,并且以一些内建机制来避免一个工作进程过载。 第二种方式是,主进程建立监听`socket`并且将它发送给感兴趣的工作进程。工作进程直接接受传入的连接。 第二种方式理论上有最好的性能。但是在实践中,操作系统的调度不可预测,分配往往十分不平衡。负载曾被观察到8个进程中,超过70%的连接结束于其中的2个进程。 因为`server.listen()`将大部分工作交给了主进程,所以一个普通的`io.js`进程和一个集群工作进程会在三种情况下有所区别: 1. `server.listen({fd: 7})` 因为消息被传递给了主进程,主进程的文件描述符`7`会被监听,并且句柄会被传递给工作进程而不是监听工作进程中文件描述符为`7`的东西。 1. `server.listen(handle)` 明确地监听句柄,会让工作进程使用给定的句柄,而不是与主进程通信。如果工作进程已经有了此句柄,那么将假设你知道你在做什么。 1. `server.listen(0)` 通常,这会导致服务器监听一个随机端口。但是,在集群中,每次调用`listen(0)`时,每一个工作进程会收到同样的“随机”端口。也就是说,端口只是在第一次方法被调用时是随机的,但在之后是可预知的。如果你想监听特定的端口,则根据工作进程的PID来生成端口号。 由于在`io.js`或你的程序中的工作进程间没有路由逻辑也没有共享的状态。所以,请不要为你的程序设计成依赖太重的内存数据对象,如设计会话和登陆时。 因为工作进程都是独立的进程,它们可以根据你程序的需要被杀死或被创建,并且并不会影响到其他工作进程。只要有活跃的工作进程,那么服务器就会继续接收连接。但是`io.js`不会自动地为你管理工作进程数。所以根据你的应用需求来管理工作进程池是你的责任。 #### cluster.schedulingPolicy 调度策略,选择`cluster.SCHED_RR`来使用循环式,或选择`cluster.SCHED_NONE`来由操作系统处理。这是一个全局设定,并且在你第一次启动了一个工作进程或调用`cluster.setupMaster()`方法后就不可再更改。 `SCHED_RR`是除了Windows外其他操作系统中的默认值。一旦`libuv`能够有效地分配IOCP句柄并且没有巨大的性能损失,那么Windows下的默认值也会变为它。 `cluster.schedulingPolicy`也可以通过环境变量`NODE_CLUSTER_SCHED_POLICY`来设定。合法值为`rr`和`none`。 #### cluster.settings - **Object** - execArgv Array 传递给`io.js`执行的字符串参数(默认为`process.execArgv`) - exec String 工作进程文件的路径(默认为`process.argv[1]`) - args Array 传递给工作进程的字符串参数(默认为`process.argv.slice(2)`) - silent Boolean 是否将工作进程的输出传递给父进程的`stdio`(默认为`false`) - uid Number 设置用户进程的ID - gid Number 设置进程组的ID 在调用`.setupMaster()`(或`.fork()`)方法之后,这个`settings`对象会存放方法的配置,包括默认值。 因为`.setupMaster()`仅能被调用一次,所以这个对象被设置后便不可更改。 这个对象不应由你来手工更改或设置。 #### cluster.isMaster - Boolean 如果进程是主进程则返回`true`。这由`process.env.NODE_UNIQUE_ID`决定。如果`process.env.NODE_UNIQUE_ID`为`undefined`,那么就返回`true`。 #### cluster.isWorker - Boolean 如果进程不是主进程则返回`true`。 #### Event: 'fork' - worker Worker object 当一个新的工作进程由`cluster`模块所开启时会触发`fork`事件。这能被用来记录工作进程活动日志,或创建自定义的超时。 ~~~ var timeouts = []; function errorMsg() { console.error("Something must be wrong with the connection ..."); } cluster.on('fork', function(worker) { timeouts[worker.id] = setTimeout(errorMsg, 2000); }); cluster.on('listening', function(worker, address) { clearTimeout(timeouts[worker.id]); }); cluster.on('exit', function(worker, code, signal) { clearTimeout(timeouts[worker.id]); errorMsg(); }); ~~~ #### Event: 'online' - worker Worker object 当创建了一个新的工作线程后,工作线程必须响应一个在线信息。当主进程接收到在线信息后它会触发这个事件。`fork`和`online`事件的区别在于:`fork`是主进程创建了工作进程后触发,`online`是工作进程开始运行时触发。 ~~~ cluster.on('online', function(worker) { console.log("Yay, the worker responded after it was forked"); }); ~~~ #### Event: 'listening' - worker Worker object - address Object 当工作进程调用`listen()`方法。服务器会触发`listening`事件,集群中的主进程也会触发一个`listening`事件。 这个事件的回调函数包含两个参数,第一个`worker`是一个包含工作进程的对象,`address`对象是一个包含以下属性的对象:`address`,`port`和`addressType`。当工作进程监听多个地址时,这非常有用。 ~~~ cluster.on('listening', function(worker, address) { console.log("A worker is now connected to " + address.address + ":" + address.port); }); ~~~ `addressType`是以下中的一个: - 4 (TCPv4) - 6 (TCPv6) - -1 (unix domain socket) - "udp4" 或 "udp6" (UDP v4 或 v6) #### Event: 'disconnect' - worker Worker object 当工作进程的IPC信道断开连接时触发。这个事件当工作进程优雅地退出,被杀死,或手工断开连接(如调用`worker.disconnect()`)后触发。 `disconnect`和`exit`事件之间可能存在延迟。这两个事件可以用来侦测是否进程在清理的过程中被阻塞,或者是否存在长连接。 ~~~ cluster.on('disconnect', function(worker) { console.log('The worker #' + worker.id + ' has disconnected'); }); ~~~ #### Event: 'exit' - worker Worker object - code Number 如果正常退出,则为退出码 - signal String 导致进程被杀死的信号的信号名(如'SIGHUP') 当任何一个工作进程结束时,`cluster`模块会触发一个`exit`事件。 这可以被用来通过再次调用`.fork()`方法重启服务器。 ~~~ cluster.on('exit', function(worker, code, signal) { console.log('worker %d died (%s). restarting...', worker.process.pid, signal || code); cluster.fork(); }); ~~~ 参阅`child_process`事件:`exit`。 #### Event: 'setup' - settings Object 每次`.setupMaster()`方法被调用时触发。 这个`settings`对象与`.setupMaster()`被调用时`cluster.settings`对象相同,并且仅供查询,因为`.setupMaster()`可能在一次事件循环里被调用多次。 如果保持精确十分重要,请使用`cluster.settings`。 #### cluster.setupMaster([settings]) - **settings Object** - exec String 工作进程文件的路径(默认为`process.argv[1]`) - args Array 传递给工作进程的参数字符串(默认为`process.argv.slice(2)`) - silent Boolean 是否将工作进程的输出传递给父进程的`stdio`(默认为`false`) `setupMaster`方法被用来改变默认的`fork`行为。一旦被调用,`settings`参数将被表现为`cluster.settings`。 注意: - 任何`settings`的改变仅影响之后的`.fork()`调用,而不影响已经运行中的工作进程 - 工作进程中唯一不同通过`.setupMaster()`来设置的属性是传递给`.fork()`方法的`env`参数 - 上文中的参数的默认值仅在第一次调用时被应用,之后的调用的默认值是当前`cluster.setupMaster()`被调用时的值。 例子: ~~~ var cluster = require('cluster'); cluster.setupMaster({ exec: 'worker.js', args: ['--use', 'https'], silent: true }); cluster.fork(); // https worker cluster.setupMaster({ args: ['--use', 'http'] }); cluster.fork(); // http worker ~~~ 这只能被主进程调用。 #### cluster.fork([env]) - env Object 将添加到工作进程环境变量的键值对 - return Worker object 创建一个新的工作进程。 这只能被主进程调用。 #### cluster.disconnect([callback]) - callback Function 当所有的工作进程断开连接并且所有句柄关闭后调用 在`cluster.workers`中的每一个工作进程中调用`.disconnect()`。 当所有进程断开连接,所有内部的句柄都将关闭,如果没有其他的事件处于等待,将允许主进程优雅地退出。 这个方法接受一个可选的将会在结束时触发的回调函数参数。 这只能被主进程调用。 #### cluster.worker - Object 当前工作进程对象的引用。对于主进程不可用。 ~~~ var cluster = require('cluster'); if (cluster.isMaster) { console.log('I am master'); cluster.fork(); cluster.fork(); } else if (cluster.isWorker) { console.log('I am worker #' + cluster.worker.id); } ~~~ #### cluster.workers - Object 一个储存了所有活跃的工作进程对象的哈希表,以`id`字段为主键。这使得遍历所有工作进程变得容易。仅在主进程中可用。 当工作进程断开连接或退出时,它会从`cluster.workers`中移除。这个两个事件的触发顺序不能被提前决定。但是,能保证的是,从`cluster.workers`移除一定发生在这两个事件触发之后。 ~~~ // Go through all workers function eachWorker(callback) { for (var id in cluster.workers) { callback(cluster.workers[id]); } } eachWorker(function(worker) { worker.send('big announcement to all workers'); }); ~~~ 想要跨越通信信道来得到一个工作进程的引用时,使用工作进程的唯一`id`能简单找到工作进程。 ~~~ socket.on('data', function(id) { var worker = cluster.workers[id]; }); ~~~ #### Class: Worker `Worker`对象包含了一个工作进程所有的公开信息和方法。在主进程中它可以通过`cluster.workers`取得。在工作进程中它可以通过`cluster.worker`取得。 #### worker.id - String 每一个新的工作进程都被给予一个独一无二的id,这个id被存储在此`id`属性中。 当一个工作进程活跃时,这是它被索引在`cluster.workers`中的主键。 #### worker.process - ChildProcess object 所有的工作进程都通过`child_process.fork()`被创建,返回的对象被作为`.process`属性存储。在一个工作进程中,全局的`process`被存储。 参阅`Child Process module` 注意,如果在进程中`disconnect`事件触发并且`.suicide`属性不为`true`,那么进程会调用`process.exit(0)`。这防止了意外的断开连接。 #### worker.suicide - Boolean 通过调用`.kill()`或`.disconnect()`设置,在这之前他为`undefined`。 布尔值`worker.suicide`使你可以区别自发和意外的退出,主进程可以通过这个值来决定使用重新创建一个工作进程。 ~~~ cluster.on('exit', function(worker, code, signal) { if (worker.suicide === true) { console.log('Oh, it was just suicide\' – no need to worry'). } }); // kill worker worker.kill(); ~~~ #### worker.send(message[, sendHandle]) - message Object - sendHandle Handle object 给工作进程或主进程发生一个信息,可选得添加一个句柄。 在主进程中它将给特定的工作进程发送一个信息。它指向`child.send()`。 在工作进程中它将给主进程发送一个信息。它指向`process.send()`。 下面的例子将来自主进程的所有信息返回: ~~~ if (cluster.isMaster) { var worker = cluster.fork(); worker.send('hi there'); } else if (cluster.isWorker) { process.on('message', function(msg) { process.send(msg); }); } ~~~ #### worker.kill([signal='SIGTERM']) - signal String 传递给工作进程的结束信号名 这个函数将会杀死工作进程。在主进程中,它通过断开`worker.process`做到,并且一旦断开,使用`signal`杀死进程。在工作进程中,它通过断开信道做到,然后使用退出码`0`退出。 会导致`.suicide`被设置。 为了向后兼任,这个方法的别名是`worker.destroy()`。 注意在工作进程中,`process.kill()`存在,但它不是这个函数。是`process.kill(pid[, signal])`。 #### worker.disconnect() 在工作进程中,这个函数会关闭所有的服务器,等待这些服务器上的`close`事件,然后断开IPC信道。 在主进程中,一个内部信息会被传递给工作进程,至使它们自行调用`.disconnect()`。 会导致`.suicide`被设置。 注意在一个服务器被关闭后,它将不会再接受新连接,但是连接可能被其他正在监听的工作进程所接收。已存在的连接将会被允许向往常一样退出。当没有更多的连接存在时,工作进程的IPC信道会关闭并使之优雅地退出,参阅`server.close()`。 以上说明仅应用于服务器连接,客户端连接将不会自动由工作进程关闭,并且在退出前,不会等到连接退出。 注意在工作进程中,`process.disconnect`存在,但它不是这个函数。是`child.disconnect()`。 由于长连接可能会阻塞工作进程的退出,这时传递一个动作信息非常有用,应用来根据信息指定的动作来关闭它们。超时机制是上述的有用实现,在`disconnect`事件在指定时长后没有触发时,杀死工作进程。 ~~~ if (cluster.isMaster) { var worker = cluster.fork(); var timeout; worker.on('listening', function(address) { worker.send('shutdown'); worker.disconnect(); timeout = setTimeout(function() { worker.kill(); }, 2000); }); worker.on('disconnect', function() { clearTimeout(timeout); }); } else if (cluster.isWorker) { var net = require('net'); var server = net.createServer(function(socket) { // connections never end }); server.listen(8000); process.on('message', function(msg) { if(msg === 'shutdown') { // initiate graceful close of any connections to server } }); } ~~~ #### worker.isDead() 如果工作进程已经被关闭,则返回`true`。 #### worker.isConnected() 如果工作进程通过它的IPC信道连接到主进程,则返回`true`。一个工作进程在被创建后连接到它的主进程。在`disconnect`事件触发后它会断开连接。 #### Event: 'message' - message Object 这个事件与`child_process.fork()`所提供的事件完全相同。 在工作进程中你也可以使用`process.on('message')`。 例子,这里有一个集群,使用消息系统在主进程中统计请求的数量: ~~~ var cluster = require('cluster'); var http = require('http'); if (cluster.isMaster) { // Keep track of http requests var numReqs = 0; setInterval(function() { console.log("numReqs =", numReqs); }, 1000); // Count requestes function messageHandler(msg) { if (msg.cmd && msg.cmd == 'notifyRequest') { numReqs += 1; } } // Start workers and listen for messages containing notifyRequest var numCPUs = require('os').cpus().length; for (var i = 0; i < numCPUs; i++) { cluster.fork(); } Object.keys(cluster.workers).forEach(function(id) { cluster.workers[id].on('message', messageHandler); }); } else { // Worker processes have a http server. http.Server(function(req, res) { res.writeHead(200); res.end("hello world\n"); // notify master about the request process.send({ cmd: 'notifyRequest' }); }).listen(8000); } ~~~ #### Event: 'online' 与`cluster.on('online')`事件相似,但指向了特定的工作进程。 ~~~ cluster.fork().on('online', function() { // Worker is online }); ~~~ 这不是在工作进程中触发的。 #### Event: 'listening' - address Object 与`cluster.on('listening')`事件相似,但指向了特定的工作进程。 ~~~ cluster.fork().on('listening', function(address) { // Worker is listening }); ~~~ 这不是在工作进程中触发的。 #### Event: 'disconnect' 与`cluster.on('disconnect')`事件相似,但指向了特定的工作进程。 ~~~ cluster.fork().on('disconnect', function() { // Worker has disconnected }); ~~~ #### Event: 'exit' - code Number 如果正常退出,则为退出码 - signal String 导致进程被杀死的信号名(如`'SIGHUP'`) 与`cluster.on('exit')`事件相似,但指向了特定的工作进程。 ~~~ var worker = cluster.fork(); worker.on('exit', function(code, signal) { if( signal ) { console.log("worker was killed by signal: "+signal); } else if( code !== 0 ) { console.log("worker exited with error code: "+code); } else { console.log("worker success!"); } }); ~~~ #### Event: 'error' 这个事件与`child_process.fork()`所提供的事件完全相同。 在工作进程中你也可以使用`process.on('error')`。
';