Modules
最后更新于:2022-04-01 01:58:43
### 稳定度: 3 - 锁定
`io.js`又一个简单的模块加载系统。在`io.js`中,文件和模块是一一对应的。以下例子中,`foo.js`加载的同目录下的`circle.js`。
`foo.js`的内容:
~~~
var circle = require('./circle.js');
console.log( 'The area of a circle of radius 4 is '
+ circle.area(4));
~~~
`circle.js`的内容:
~~~
var PI = Math.PI;
exports.area = function (r) {
return PI * r * r;
};
exports.circumference = function (r) {
return 2 * PI * r;
};
~~~
`circle.js`模块暴露了`area()`函数和`circumference()`函数。想要为你的模块添加函数或对象,你可以将它们添加至特殊的`exports`对象的属性上。
模块的本地变量是私有的,好似模块被包裹在一个函数中。在这个例子中变量`PI`是`circle.js`私有的。
如果想要你的模块暴露一个函数(例如一个构造函数),或者想要一次赋值就暴露一个完整的对象,而不是一次绑定一个属性,那就将之赋值给`module.exports`而不是`exports`。
以下,`bar.js`使用了暴露了一个构造函数的`square`模块:
~~~
var square = require('./square.js');
var mySquare = square(2);
console.log('The area of my square is ' + mySquare.area());
~~~
`square`模块内部:
~~~
// assigning to exports will not modify module, must use module.exports
module.exports = function(width) {
return {
area: function() {
return width * width;
}
};
}
~~~
模块系统在`require("module")`中被实现。
### 循环依赖
当存在循环的`require()`调用。一个模块可能在返回时,被没有被执行完毕。
考虑一下情况:
`a.js`:
~~~
console.log('a starting');
exports.done = false;
var b = require('./b.js');
console.log('in a, b.done = %j', b.done);
exports.done = true;
console.log('a done');
~~~
`b.js`:
~~~
console.log('b starting');
exports.done = false;
var a = require('./a.js');
console.log('in b, a.done = %j', a.done);
exports.done = true;
console.log('b done');
~~~
`main.js`:
~~~
console.log('main starting');
var a = require('./a.js');
var b = require('./b.js');
console.log('in main, a.done=%j, b.done=%j', a.done, b.done);
~~~
当`main.js`加载`a.js`,而后`a.js`会去加载`b.js`。与此同时,`b.js`尝试去加载`a.js`。为了避免一个无限循环,`a.js`会返回一个未完成的副本给`b.js`模块。`b.js`会接着完成加载,然后它所暴露的值再被提供给`a.js`模块。
这样`main.js`就完成了它们的加载。因此程序的输出是:
~~~
$ iojs main.js
main starting
a starting
b starting
in b, a.done = false
b done
in a, b.done = true
a done
in main, a.done=true, b.done=true
~~~
如果在你的程序里有循环依赖,请确保它们按你的计划工作。
#### 核心模块
`io.js`中有一些模块是被编译成二进制的。这些模块会在本文档的其他地方详细讨论。
核心模块被定义在`io.js`源码的`lib/`目录下。
当被`require()`时,核心模块总是被优先加载的。例如`require('http')`总是会返回内建的HTTP模块,甚至是有一个同名文件时。
#### 文件模块
如果准确的文件名没有被发现,那么`io.js`将会依次添加`.js`,`.json`或`.node`后缀名,然后试图去加载。
`.js`文件被解释为`JavaScript`文本文件,`.json`被解释为`JSON`文本文件,`.node`文件被解释为编译好的插件模块,然后被`dlopen`加载。
前缀是`'/'`则是文件的绝对路径。例如`require('/home/marco/foo.js')`将会加载`/home/marco/foo.js`。
前缀是`'./'`则是调用`require()`的文件的相对路径。也就是说,`circle.js`必须与`foo.js`在同一目录下,这样`require('./circle')`才能找到它。
如果没有`'/'`,`'./'`或`'../'`前缀,模块要么是一个核心模块,或是需要从`node_modules`目录中被加载。
如果指定的路径不存在,`require()`将会抛出一个`code`属性是`'MODULE_NOT_FOUND'`的错误。
#### 从node_modules目录中加载
如果传递给`require()`的模块标识符不是一个本地模块,也没有以`'/'`,`'../'`或`'./'`开始。那么`io.js`将会从当前目录的父目录开始,添加`/node_modules`,试图从这个路径来加载模块。
如果还是没有找到模块,那么它会再移至此目录的父目录,如此往复,直至到达文件系统的根目录。
例如,如果一个位于`'/home/ry/projects/foo.js'`的文件调用了`require('bar.js')`,那么`io.js`将会按照以下的路径顺序来查找:
~~~
/home/ry/projects/node_modules/bar.js
/home/ry/node_modules/bar.js
/home/node_modules/bar.js
/node_modules/bar.js
~~~
这要求程序本地化(localize)自己的依赖,防止它们崩溃。
你也可以在模块名中加入一个路径后缀,来引用这个模块中特定的一个文件或子模块。例如,`require('example-module/path/to/file')`将会从`example-module`的位置解析相对路径`path/to/file`。路径后缀遵循相同的模块解析语义。
#### 作为模块的目录
在一个单独目录下组织程序和库,然后提供一个单独的入口,是非常便捷的。有三种方法,可以将目录作为`require()`的参数,来加载模块。
第一种方法是,在模块的根目录下创建一个`package.json`文件,其中指定了`main`模块。一个示例`package.json`文件:
~~~
{ "name" : "some-library",
"main" : "./lib/some-library.js" }
~~~
如果这个文件位于`./some-library`,那么`require('./some-library')`将会试图去加载`./some-library/lib/some-library.js`。
这就是`io.js`所能够了解`package.json`文件的程度。
如果目录中没有`package.json`文件,那么`io.js`将会视图去加载当前目录中的`index.js`或`index.node`。例如,如果在上面的例子中没有`package.json`,那么`require('./some-library')`将会试图加载:
~~~
./some-library/index.js
./some-library/index.node
~~~
#### 缓存
模块在第一次被加载后,会被缓存。这意味着,如果都解析到了相同的文件,每一次调用`require('foo')`都将会返回同一个对象。
多次调用`require('foo')`可能不会造成模块代码被执行多次。这是一个重要的特性。有了它,“部分完成”的对象也可以被返回,这样,传递依赖也能被加载,即使它们可能会造成循环依赖。
如果你想要一个模块被多次执行,那么就暴露一个函数,然后执行这个函数。
##### 模块缓存警告
模块的缓存依赖于它们被解析后的文件名。所以调用模块的位置不同,可以会解析出不同的文件名(比如需要从node_modules目录中加载)。所以不能保证`require('foo')`总是会返回相同的对象,因为它们可能被解析为了不同的文件。
#### module对象
- {Object}
每一个模块中,变量`module`是一个代表了当前模块的引用。为了方便,`module.exports`也可以通过模块作用域中的`exports`取得。`module`对象实际上不是全局的,而是每个模块本地的。
#### module.exports
- Object
`module.exports`对象是由模块系统创建的。有时这是难以接受的;许多人希望它们的模块是一些类的实例。如果需要这样,那么就将想要暴露的对象赋值给`module.exports`。注意,将想要暴露的对象传递给`exports`,将仅仅只会重新绑定(rebind)本地变量`exports`,所以不要这么做。
例如假设我们正在写一个叫做`a.js`的模块:
~~~
var EventEmitter = require('events').EventEmitter;
module.exports = new EventEmitter();
// Do some work, and after some time emit
// the 'ready' event from the module itself.
setTimeout(function() {
module.exports.emit('ready');
}, 1000);
~~~
那么在另一个文件中我们可以:
~~~
var a = require('./a');
a.on('ready', function() {
console.log('module a is ready');
});
~~~
主要,对`module.exports`的赋值必须立刻完成。它不能在任何的回调函数中完成。以下例子将不能正常工作:
`x.js`:
~~~
setTimeout(function() {
module.exports = { a: "hello" };
}, 0);
~~~
`y.js`:
~~~
var x = require('./x');
console.log(x.a);
~~~
#### exports快捷方式
`exports`变量是一个`module.exports`的引用。如果你将一个新的值赋予它,那么它将不再指向先前的那个值。
为了说明这个行为,将`require()`的实现假设为这样:
~~~
function require(...) {
// ...
function (module, exports) {
// Your module code here
exports = some_func; // re-assigns exports, exports is no longer
// a shortcut, and nothing is exported.
module.exports = some_func; // makes your module export 0
} (module, module.exports);
return module;
}
~~~
一个指导方针是,如果你弄不清楚`exports`和`module.exports`之间的关系,请只使用`module.exports`。
#### module.require(id)
- id String
- Return: 被解析的模块的`module.exports`
`module.require`方法提供了一种像`require()`一样,从源模块中加载模块的方法。
注意,为了这么做,你必须取得`module`对象的引用。因为`require()`返回`module.exports`,并且`module`对象是一个典型的只在特定的模块作用域中有效的变量,如果要使用它,必须被明确地导出。
#### module.id
- String
模块的识别符。通常是被完全解析的文件名。
#### module.filename
- String
模块完全解析后的文件名。
#### module.loaded
- Boolean
模块是否加载完成,或者是正在加载的过程中。
#### module.parent
- Module Object
引用这个模块的模块。
#### module.children
- Array
这个模块所引入的模块。
#### 总体来说
为了获得`require()`被调用时将要被加载的准确文件名,使用`require.resolve()`函数。
综上所述,以下是一个`require.resolve`所做的事的高级算法伪代码:
~~~
require(X) from module at path Y
1. If X is a core module,
a. return the core module
b. STOP
2. If X begins with './' or '/' or '../'
a. LOAD_AS_FILE(Y + X)
b. LOAD_AS_DIRECTORY(Y + X)
3. LOAD_NODE_MODULES(X, dirname(Y))
4. THROW "not found"
LOAD_AS_FILE(X)
1. If X is a file, load X as JavaScript text. STOP
2. If X.js is a file, load X.js as JavaScript text. STOP
3. If X.json is a file, parse X.json to a JavaScript Object. STOP
4. If X.node is a file, load X.node as binary addon. STOP
LOAD_AS_DIRECTORY(X)
1. If X/package.json is a file,
a. Parse X/package.json, and look for "main" field.
b. let M = X + (json main field)
c. LOAD_AS_FILE(M)
2. If X/index.js is a file, load X/index.js as JavaScript text. STOP
3. If X/index.json is a file, parse X/index.json to a JavaScript object. STOP
4. If X/index.node is a file, load X/index.node as binary addon. STOP
LOAD_NODE_MODULES(X, START)
1. let DIRS=NODE_MODULES_PATHS(START)
2. for each DIR in DIRS:
a. LOAD_AS_FILE(DIR/X)
b. LOAD_AS_DIRECTORY(DIR/X)
NODE_MODULES_PATHS(START)
1. let PARTS = path split(START)
2. let I = count of PARTS - 1
3. let DIRS = []
4. while I >= 0,
a. if PARTS[I] = "node_modules" CONTINUE
c. DIR = path join(PARTS[0 .. I] + "node_modules")
b. DIRS = DIRS + DIR
c. let I = I - 1
5. return DIRS
~~~
#### 从全局文件夹加载
如果`NODE_PATH`环境变量被设置为了一个以冒号分割的绝对路径列表,那么在找不到模块时,`io.js`将会从这些路径中寻找模块(注意:在Windows中,`NODE_PATH`是以分号间隔的)。
`NODE_PATH`最初被创建,是用来支持在当前的模块解析算法被冻结(frozen)前,从不同的路径加载模块的。
`NODE_PATH`仍然被支持,但是,如今`io.js`生态圈已经有了放置依赖模块的公约,它已经不那么必要的。有时,当人们没有意识到`NODE_PATH`有被设置时,依赖于`NODE_PATH`的部署可能会产生出人意料的表现。有时,一个模块的依赖改变了,造成了通过`NODE_PATH`,加载了不同版本的模块。
另外,`io.js`将会查找以下路径:
- 1: $HOME/.node_modules
- 2: $HOME/.node_libraries
- 3: $PREFIX/lib/node
`$HOME`是用户的家目录,`$PREFIX`是`io.js`中配置的`node_prefix`。
由于一些历史原因,高度推荐你将依赖放入`node_modules`目录。它会被加载的更快,且可靠性更好。
#### 访问主模块
当一个文件直接由`io.js`执行,`require.main`将被设置为这个模块。这意味着你可以判断一个文件是否是直接被运行的。
~~~
require.main === module
~~~
对于一个文件`foo.js`,如果通过`iojs foo.js`运行,以上将会返回`true`。如果通过`require('./foo')`,将会返回`false`。
因为`module`提供了一个`filename`属性(通常等于`__filename`),所以当前应用的入口点可以通过检查`require.main.filename`来获取。
#### 附录:包管理小贴士
`io.js`的`require()`函数的语义被设计得足够通用,来支持各种目录结构。包管理程序诸如`dpkg`,`rpm`和`npm`将可以通过不修改`io.js`模块,来构建本地包。
以下我们给出一个建议的可行的目录结构:
假设`/usr/lib/node/<some-package>/<some-version>`中有指定版本包的内容。
包可以依赖于其他包。为了安装`foo`包,你可能需要安装特定版本的`bar`包。`bar`包可能有它自己的依赖,在一些情况下,它们的依赖可以会冲突或者产生循环。
由于`io.js`会查找任何它加载的包得真实路径(也就是说,解析`symlinks`),解析以下结构的方案非常简单:
- /usr/lib/node/foo/1.2.3/ - `foo`包的内容,`1.2.3`版本。
- /usr/lib/node/bar/4.3.2/ - `foo`包所依赖的`bar`包的内容。
- /usr/lib/node/foo/1.2.3/node_modules/bar - 指向`/usr/lib/node/bar/4.3.2/`的符号链接。
- /usr/lib/node/bar/4.3.2/node_modules/* - 指向`bar`包所依赖的包的符号链接。
因此,即使有循环依赖,或者依赖冲突,每个模块都能够获取它们使用的特定版本的依赖。
当`foo`包中的代码执行`require('bar')`,将会获得符号链接`/usr/lib/node/foo/1.2.3/node_modules/bar`指向的版本。接着,`bar`包种的代码执行`require('quux')`,它将会获得符号链接`/usr/lib/node/bar/4.3.2/node_modules/quux`指向的版本。
此外,为了优化模块查找的过程,我们将模块放在`/usr/lib/node_modules/<name>/<version>`而不是直接放在`/usr/lib/node`中。然后在找不到依赖时,`io.js`就不会一直去查找`/usr/node_modules`或`/node_modules`目录了。
为了让模块在`io.js`的REPL中可用,可能需要将`/usr/lib/node_modules`目录加入到`$NODE_PATH`环境变量。因为使用`node_modules`目录的模块查找都是使用相对路径,且基于调用`require()`的文件的真实路径,因此包本身可以在任何位置。