5.10.生命周期
最后更新于:2022-04-01 00:43:48
这篇教程是现行3个Rust所有权系统之一。所有权系统是Rust最独特且最引人入胜的特性之一,也是作为Rust开发者应该熟悉的。Rust所追求最大的目标 -- 内存安全,关键在于所有权。所有权系统有一些不同的概念,每个概念独自成章:
* [所有权](http://kaisery.gitbooks.io/rust-book-chinese/content/content/5.8.Ownership%20%E6%89%80%E6%9C%89%E6%9D%83.md),关键章节
* [借用](http://kaisery.gitbooks.io/rust-book-chinese/content/content/5.9.References%20and%20Borrowing%20%E5%BC%95%E7%94%A8%E5%92%8C%E5%80%9F%E7%94%A8.md),以及它关联的特性: "引用" (references)
* 生命周期,你正在阅读的这个章节
这3章依次互相关联,你需要完整地阅读全部3章来对Rust的所有权系统进行全面的了解。
## 原则(Meta)
在我们开始详细讲解之前,这有两点关于所有权系统重要的注意事项。
Rust注重安全和速度。它通过很多_零开销抽象_(_zero-cost abstractions_)来实现这些目标,也就是说在Rust中,实现抽象的开销尽可能的小。所有权系统是一个典型的零开销抽象的例子。本文提到所有的分析都是**在编译时完成的**。你不需要在运行时为这些功能付出任何开销。
然而,这个系统确实有一个开销:学习曲线。很多Rust初学者会经历我们所谓的“与借用检查器作斗争”的过程,也就是指Rust编译器拒绝编译一个作者认为合理的程序。这种“斗争”会因为程序员关于所有权系统如何工作的基本模型与Rust实现的实际规则不匹配而经常发生。当你刚开始尝试Rust的时候,你很可能会有相似的经历。然而有一个好消息:更有经验的Rust开发者反应,一旦他们适应所有权系统一段时间之后,与借用检查器的冲突会越来越少。
记住这些之后,让我们来学习有关生命周期的内容。
## 生命周期
借出一个其它人所有资源的引用可以是很复杂的。例如,想象一下下列操作:
1. 我获取了一个某种资源的句柄
2. 我借给你了一个引用
3. 我决定不再需要这个资源了,然后释放了它,这时你仍然持有它的引用
4. 你决定使用这个资源
噢!你的引用指向一个无效的资源。这叫做_悬垂指针_(_dangling pointer_)或者“释放后使用”,如果这个资源是内存的话。
要修正这个问题的话,我们必须确保第四步永远也不在第三步之后发生。Rust所有权系统通过一个叫_生命周期_(_lifetime_)的概念来做到这一点,它定义了一个引用有效的作用域。
当我们有一个获取引用作为参数的函数,我们可以隐式或显式涉及到引用的生命周期:
~~~
// implicit
fn foo(x: &i32) {
}
// explicit
fn bar<'a>(x: &'a i32) {
}
~~~
`'a`读作“生命周期a”。技术上讲,每一个引用都有一些与之相关的生命周期,不过编译器在通常情况让你可以省略它们。在我们讲到它之前,让我们拆开显式的例子看看:
~~~
fn bar<'a>(...)
~~~
这一部分声明了我们的生命周期。它说`bar`有一个生命周期,`'a`。如果我们有两个生命周期,它看起来像这样:
~~~
fn bar<'a, 'b>(...)
~~~
接着在我们的参数列表中,我们使用了我们命名的生命周期:
~~~
...(x: &'a i32)
~~~
如果我们想要一个`&mut`引用,我们这么做:
~~~
...(x: &'a mut i32)
~~~
如果你对比一下`&mut i32`和`&'a mut i32`,他们是一样的,只是后者在`&`和`mut i32`之间夹了一个`'a`生命周期。`&mut i32`读作“一个`i32`的可变引用”,而`&'a mut i32`读作“一个带有生命周期'a的i32的可变引用”。
当你处理[结构体](http://kaisery.gitbooks.io/rust-book-chinese/content/content/5.12.Structs%20%E7%BB%93%E6%9E%84%E4%BD%93.md)时你也需要显式的生命周期:
~~~
struct Foo<'a> {
x: &'a i32,
}
fn main() {
let y = &5; // this is the same as `let _y = 5; let y = &_y;`
let f = Foo { x: y };
println!("{}", f.x);
}
~~~
如你所见,`struct`也可以有生命周期。跟函数类似的方法,
~~~
struct Foo<'a> {
~~~
声明一个生命周期,接着
~~~
x: &'a i32,
~~~
使用它。然而为什么这里我们需要一个生命周期呢?因为我们需要确保任何`Foo`的引用不能比它包含的`i32`的引用活的更久。
## 理解作用域(Thinking in scopes)
理解生命周期的一个办法是想象一个引用有效的作用域。例如:
~~~
fn main() {
let y = &5; // -+ y goes into scope
// |
// stuff // |
// |
} // -+ y goes out of scope
~~~
加入我们的`Foo`:
~~~
struct Foo<'a> {
x: &'a i32,
}
fn main() {
let y = &5; // -+ y goes into scope
let f = Foo { x: y }; // -+ f goes into scope
// stuff // |
// |
} // -+ f and y go out of scope
~~~
我们的`f`生存在`y`的作用域之中,所以一切正常。那么如果不是呢?下面的代码不能工作:
~~~
struct Foo<'a> {
x: &'a i32,
}
fn main() {
let x; // -+ x goes into scope
// |
{ // |
let y = &5; // ---+ y goes into scope
let f = Foo { x: y }; // ---+ f goes into scope
x = &f.x; // | | error here
} // ---+ f and y go out of scope
// |
println!("{}", x); // |
} // -+ x goes out of scope
~~~
噢!就像你在这里看到的一样,`f`和`y`的作用域小于`x`的作用域。不过当我们尝试`x = &f.x`时,我们让`x`引用一些将要离开作用域的变量。
命名作用域用来赋予作用域一个名字。有了名字是我们可以谈论它的第一步。
## 'static
叫做`static`的作用域是特殊的。它代表其具有一个整个程序的作用域。大部分Rust程序员当他们处理字符串时第一次遇到`'static`:
~~~
let x: &'static str = "Hello, world.";
~~~
基本字符串是`&'static str`类型的因为它的引用一直有效:它们被写入了最终库文件的数据段。另一个例子是全局量:
~~~
static FOO: i32 = 5;
let x: &'static i32 = &FOO;
~~~
它在二进制文件的数据段中保存了一个`i32`,而`x`是它的一个引用。
## 生命周期省略(Lifetime Elision)
Rust支持强大的在函数体中的局部类型推断,不过这在项签名中是禁止的以便允许只通过项签名本身推导出类型。然而,为了一些人道原因有第二个非常限制的叫做“生命周期省略”的推断算法适用于函数签名。它只基于签名部分自身推断而不涉及函数体,只推断生命周期参数,并且只基于3个易于记忆和无歧义的规则,虽然并不隐藏它涉及到的实际类型因为局部推断可能会适用于它。
当我们讨论生命周期省略的时候,我们使用_输入生命周期和输出生命周期_(_input lifetime and output lifetime._)。_输入生命周期_是关于函数参数的,而_输出生命周期_是关于函数返回值的。例如,这个函数有一个输入生命周期:
~~~
fn foo<'a>(bar: &'a str)
~~~
这个有一个输出生命周期:
~~~
fn foo<'a>() -> &'a str
~~~
这个两者皆有:
~~~
fn foo<'a>(bar: &'a str) -> &'a str
~~~
这里有3条规则:
* 每一个被省略的函数参数成为一个不同的生命周期参数。
* 如果确实有一个输入生命周期,不管是否省略,这个生命周期被赋予所有函数返回值中被省略的生命周期。
* 如果这里有多个输入生命周期,不过它们当中有一个是`&self`或者`&mut self`,`self`的生命周期被赋予所有省略的输出生命周期。
否则,省略一个输出生命周期将是一个错误。
## 例子
这里有一些省略了生命周期的函数的例子。我们用它们的扩展形式配对了每个省略了生命周期的例子。
~~~
fn print(s: &str); // elided
fn print<'a>(s: &'a str); // expanded
fn debug(lvl: u32, s: &str); // elided
fn debug<'a>(lvl: u32, s: &'a str); // expanded
// In the preceding example, `lvl` doesn’t need a lifetime because it’s not a
// reference (`&`). Only things relating to references (such as a `struct`
// which contains a reference) need lifetimes.
fn substr(s: &str, until: u32) -> &str; // elided
fn substr<'a>(s: &'a str, until: u32) -> &'a str; // expanded
fn get_str() -> &str; // ILLEGAL, no inputs
fn frob(s: &str, t: &str) -> &str; // ILLEGAL, two inputs
fn frob<'a, 'b>(s: &'a str, t: &'b str) -> &str; // Expanded: Output lifetime is unclear
fn get_mut(&mut self) -> &mut T; // elided
fn get_mut<'a>(&'a mut self) -> &'a mut T; // expanded
fn args<T:ToCStr>(&mut self, args: &[T]) -> &mut Command // elided
fn args<'a, 'b, T:ToCStr>(&'a mut self, args: &'b [T]) -> &'a mut Command // expanded
fn new(buf: &mut [u8]) -> BufWriter; // elided
fn new<'a>(buf: &'a mut [u8]) -> BufWriter<'a> // expanded
~~~