Rust: 生命周期

前面我们讲解了 Rust 中 所有权借用 这两个重要概念,今天就接着来介绍一下,所有权系统三剑客的最后一位:生命周期

在 Rust 中,每个变量都有严格的生命周期限定。生命周期的主要目的,是防止垂悬指针出现。

我们先来看下面一段程序:

fn main() {
    let a;

    {
        let b = 5;
        a = &b; // error: borrowed value does not live long enough
    }

    println!("{}", a);
}

当我们编译上面代码时,会出现一个异常,提示我们变量 b 的生命周期太短,不能借用给生命周期较长的变量 a。

这很容易理解,出了块级作用域,变量 b 就被销毁了,变量 a 拿到的,只是一个垂悬指针,编译器不允许这种现象发生。

如果使用一种标记来指明变量 a 和 b 的生命周期,将会是下面这样:

fn main() {
    let a;              // ---------+-- 'a
                        //          |
    {                   //          |
        let b = 5;      // -+-- 'b  |
        a = &b;         //  |       |
    }                   // -+       |
                        //          |
    println!("{}", a);  //          |
}                       // ---------+

在函数体内部,变量的生命周期是可以自动推断的,一个变量的生命周期,从声明语句开始,到不再被使用时结束,我们也无需手动声明上面的 'a'b

但是,在封装一个函数时,对于函数的参数和返回值,编译器无法静态推断出它们的生命周期,这时候,我们要显式声明生命周期。

下面,我们先来试着封装一个函数,根据传递进来的两个字符串参数,返回较长的那个字符串:

fn get_longest(s1: &String, s2: &String) -> &String {
    if s1.len() > s2.len() {
        s1
    } else {
        s2
    }
}

看起来,这个函数一点毛病没有。接下来我们就来调用一下:

fn main() {
    let s1 = String::from("hey");
    let s2 = String::from("hello");
    let longest = get_longest(&s1, &s2);
    println!("{}", longest);
}

这时候我们发现,编译器给我们报了个错误,提示 get_longest() 函数的返回值是一个借用,但是缺少生命周期标识,编译器无法判断是来自哪个入参的借用:

fn get_longest(s1: &String, s2: &String) -> &String {
                   -------      -------     ^ expected named lifetime parameter

热心的编译器甚至给出了改进建议:

help: consider introducing a named lifetime parameter

fn get_longest<'a>(s1: &'a String, s2: &'a String) -> &'a String {
              ^^^^     ^^^^^^^^^^      ^^^^^^^^^^     ^^^

编译器似乎在说:你起码要告诉我,参数值都属于同一个生命周期范围吧。

你可能会觉得纳闷儿,变量 s1 和 s2 的生命周期都是一样的,难道编译器不知道吗?

编译器是知道的,但我们封装的函数,是可以在多个地方调用的,比如下面这样:

fn main() {
    let s1 = String::from("hey");

    let longest;

    {
        let s2 = String::from("hello");

        longest = get_longest(&s1, &s2);
    }

    println!("{}", longest);
}

是不是跟我们第一个例子很相似?根据我们的推断,最长的字符串是 s2,那么作为 s2 的借用,变量 longest 会成为一个垂悬指针。

所以总得给编译一些指示吧,让它根据参数的生命周期标识,来判定代码是否安全。

那我们就改造一下 get_longest() 方法,就像下面这样,在方法名后面,加入一个类似泛型的标记,并指定生命周期 'a,然后为参数和返回值都加上生命周期限定符:

fn get_longest<'a>(s1: &'a String, s2: &'a String) -> &'a String {
    if s1.len() > s2.len() {
        s1
    } else {
        s2
    }
}

编译顺利通过。

这个时候,你可能想问,前面的例子中,s1s2 是不同的生命周期,但在 get_longest() 函数声明中,统一都使用了 'a 标记,这也能行?

实际上,编译器会替我们处理这个问题,当 s1s2 的生命周期范围不同时,'a 会被解析为生命周期最小的那个范围。

这样,问题就得以解决了。编译器限定这个函数,总会返回生命周期最小的借用,如果这个借用,超出了它自己的生命周期继续使用,编译器就会及时抛出异常,提前规避风险。

如果你觉得仅使用 'a 不够精确,还可以尝试下面这种方式,为两个参数都指定自己的生命周期标识:

// 'a : 'b 表示 'a 大于或等于 'b
fn get_longest<'a, 'b>(s1: &'a String, s2: &'b String) -> &'b String where 'a : 'b {
    if s1.len() > s2.len() {
        s1
    } else {
        s2
    }
}

fn main() {
    let s1 = String::from("hey");

    {
        let s2 = String::from("hello");

        let longest = get_longest(&s1, &s2);

        println!("{}", longest);
    }
}

除了函数参数,生命周期标记也会出现在结构体定义中,帮助编译器检查每个结构体字段的生命周期,以确保不会出现垂悬指针:

struct Coord<'a, 'b> {
    x: &'a i32,
    y: &'b i32,
}

fn main() {
    let m;
    let x = 3;

    {
        let y = 5;

        let coord = Coord { x: &x, y: &y };

        println!("{}", coord.y);

        m = coord.x;
    }

    println!("{}", m);
}

最后,Rust 中还存在一个特殊的生命周期:'static,其存活周期将横跨整个程序运行期。

所有的字符串字面量都拥有 'static 生命周期,我们也可以像下面这样给它标注出来:

let s: &'static str = "I have a static lifetime.";

关于生命周期,就先介绍到这里了。

posted @ 2020-01-18 15:05  liuhe688  阅读(334)  评论(0编辑  收藏  举报