左值和右值
环境:mac os + xcode
一、背景
作为c++程序员,相信我们都写过如下代码:
void fun(int &x){} int main(int argc, const char * argv[]) { // insert code here... fun(10); return 0; }
编译的时候提示如下:
Candidate function not viable: expects an lvalue for 1st argument
上述报错中因为10是rvalue,而函数入参需要lvalue类型参数。
二、历史
在正式介绍左值和右值之前,我们先了解其历史。
编程语言CPL第一次引入了值类别,不过其定义比较简单,即对于赋值运行符。在运算符左边的为左值,在运算符右边的为右值。
C语言遵循与CPL类似的分类方法,但是弱化了赋值的作用,C语言中表达式被分为左值和其它(函数和非对象值),其中左值被定义为标志一个对象的表达式。不过,C语言中的左值与CPL中的左值区别是,C语言中lvalue是locator value的简写,因此lvalue对应了一块内存地址。
c++11之前,左值遵循了C语言的分类方法,但与C不同的是,其将非左值表达式统称为右值,函数为左值,并添加了引用能绑定到左值但唯有const的引用能绑定到右值。几种非左值的c表达式在c++中成为了左值表达式。
自c++11开始,对值类别又进行了细分类,在原有左值的基础上增加了纯右值和消亡值,并对以上三种类型通过是否具名(identity)和可移动(moveable),又增加了glvalue和rvalue两种组合类型。
三、表达式
C/C++代码是由标志符、表达式和语句以及一些必要的符号(大括号等)组成。
表达式由安装语言规则排列的运算符、常量和变量组成。一个表达式可以包含一个或多个操作数,零个或多个运算符来计算值。每个表达式都会产生一些值,该值将在赋值运算符的帮助下分配给变量。
在C/C++中,表达式有很多种,我们常见的有前后缀表达式、条件运算表达式等。字面值(literal)和变量(variable)是最简单的表达式,函数的返回值也被认为是表达式。
表达式是可求值的,对表达式求值可得到一个结果,这个结果有两个属性:
- 类型:这个很常见,比如int、string、引用或者自定义类型。类型确定了表达式可以进行哪些操作。
- 值类别。
四、值类别
在上节中,我们提到表达式上可求值的,而值类别就是求值结果的属性之一。
在C++11之前,表达式的值可分为左值和右值两种,其中右值就是我们理解中的字面值1、true、NULL等。
自C++11开始,表达式的值分为左值(lvalue,left value)、将亡值(xvalue,expiring value)、纯右值(pvalue,pure value)以及两种混合类别泛左值(glvalue,gegeralized lvalue)和右值(rvalue,right value)五种。
这五种类别的分类基于表达式的两个特征:
- 具名(identify):可以确定表达式是否与另一表达式指代同一实体,例如通过比较它们所标识的对象或函数的(直接或间接获得的)地址。
- 可被移动:移动构造函数、赋值函数运算符或实现了移动语义的其他函数重载能够绑定于这个表达式。
结合上述两个特征,对于五种表达式值类别进行重新定义:
- lvalue:具名且不可移动
- xvalue:具名且可被移动
- prvalue:不具名且可被移动
- glvalue:具名,lvalue和xvalue都属于glvalue
- rvalue:可被移动的表达式,prvalue和xvalue都属于rvalue
五、左值
左值(lvalue,left value),顾名思义就是赋值符号左边的值。准确来说,左值是表达式结束(不一定是复制表达式)后依然存在的对象。
可以将左值看作是一个关联了名称的内存位置,运行程序的其他部分来访问它。这这里,我们将“名称”解释为任何可以用于访问内存位置的表达式。所以,如果arr是一个数组,那么arr[1]和*(arr+1)都将被视为相同内存位置的“名称”。
左值具有以下特征:
- 可通过取地址运算符取其地址。
- 可修改的左值可用作内建赋值和内建符合赋值运算符的左操作数。
- 可以用来初始化左值引用。
那么哪些都是左值呢?其实左值基本覆盖了所有的类型:
- 变量名、函数名已经成员名。
- 返回左值引用的函数调用。
- 由赋值运算符或复合赋值运算符连接的表达式,如(a=b,b-=b等)。
- 解引用表达式*ptr。
- 前置自增和自减表达式(++a,++b)。
- 成员访问(点)运算符的结果。
- 由指针访问成员(->)运算符的结果。
- 下标运算符的结果([])。
- 字符串字面值("abc")。
为了能更加清晰地理解左值,举例说明如下:
int a = 1; // a是左值 T& f(); f();//左值 ++a;//左值 --a;//左值 int b = a;//a和b都是左值 struct S* ptr = &obj; // ptr为左值 arr[1] = 2; // 左值 int *p = &a; // p为左值 *p = 10; // *p为左值 class MyClass{}; MyClass c; // c为左值 "abc"
对于一个表达式,凡是对其取地址(&)操作可以成功的都是左值。
六、纯右值
在前面有提到过,自C++11开始,纯右值(pvalue,pure ravlue)相当于之前的右值,那么什么是纯右值呢?
字面值或者函数返回的非引用都是纯右值。
以下表达式都的值都是纯右值:
- 字面值(字符串字面值除外),例如1,‘a’,true等。
- 返回值为非引用的函数调用或操作符重载,例如:str.substr(1,2),str1+str2,or it++。
- 后自增和自减表达式(a++,a--)。
- 算术表达式。
- 逻辑表达式。
- 比较表达式。
- 取地址表达式。
- lambda表达式。
为了加深对右值的理解,下面的例子是常见的纯右值:
nullptr; true; 1; int fun(); fun(); int a = 1; int b = 2; a + b; a++; b--; a > b; a && b;
纯右值特征:
- 等同于C++11之前的右值。
- 不会是多态。
- 不会是抽象类型和数组。
- 不会是不完全类型。
七、将亡值
将亡值(xvalue,expiring value),顾名思义即将消亡的值,是C++11新增的跟右值引用相关的表达式,通常是要将被移动的对象(移为他用),比如返回右值引用T&&的函数返回值、std::move的返回值,或者转为T&&的类型转换函数的返回值。
将亡值可以理解为通过“盗取”其它变量内存空间的方式获取到的值。在确定其他变量不再被使用、或即将被销毁时,通过“盗取”的方式可以避免内存空间的释放和分配,能够延长变量值的生命周期。(通过右值引用来续命)。
xvalue只能通过两种方式来获得,这两种方式都涉及到将一个左值赋值给(转化为)一个右值引用:
- 返回右值引用的函数的调用表达式,如static_cast<T&&>(t);该表达式得到一个xvalue
- 转换为右值引用的转换函数的调用表达式,如std::move(t)、static_cast<T&&>(t)
下面通过几个代码来详细分析什么是将亡值:
std::string fun() { std::string str; // ... return str; } std::string s = fun();
在函数fun()中,str是一个局部变量,并在函数结束时被返回。
在C++11之前,s=fun();会调用拷贝构造函数,会将整个str复制一份,然后把str销毁。如果str特别大的话,会造成大量额外开销。在这一行中,s是左值,fun()右值(纯右值),fun()产生的那个返回值作为一个临时值,一旦str被s复制后,将被销毁,无法获取,也不能修改。
自C++11开始,引入了move语义,编译器会将这部分优化为move操作,即不再是之前的复制操作,而是move。此时,str会被进行隐式转换,等价于static_cast<std::string&&>(str),进而此处的s会将fun返回的值进行移动。
无论是C++11之前的拷贝,还是C++11的move,str在填充(拷贝或者move)给s之后,将被销毁,而被销毁的这个值,就成为将亡值。
将亡值就定义这样一种行为:具名的临时值、同时又能够被move。
八、混合类型
8.1 泛左值
泛左值(glvalue,generalized lvalue),又称为广义左值,是具名表达式,对应了一块内存。glvalue有lvalue和xvalue两种形式。
一个表达式是具名的,则称为glvalue。例如:
struct S{ int n; }; S fun(); S s; s; std::move(s); fun(); S{}; S{}.n;
上述代码中:
- 定义了结构体S和函数fun()
- 第6行声明了类型为S的变量s,因为其是具名的,所以是glvalue
- 第7行同上,因为s具名,所以为glvalue
- 第8行中调用了move函数,将左值s转换成xvalue,所以不是gvalue。
- 第10行中,fun()是不具名的,是纯右值,所以不是glvalue。
- 第11行中,生产一个不具名的临时变量,是纯右值,所以不是gvalue
- 第12行中,n具名,所以是glvalue
glvalue的特征如下:
- 可以自动转换成prvalue
- 可以说多态的
- 可以说不完整的类型,如前置声明但未定义的类类型
8.2 右值
右值(rvalue,right value)是指可以移动的表达式。prvalue和xvalue都rvalue,具体的示例如下:
rvalue具有以下特征:
- 无法对rvalue进行取地址操作。例如:&1,&(a+b),这些表达式没有意义,也编译不过。
- rvalue可以用来初始化const左值引用。例如:const int&a=1;
- rvalue可以用来初始化右值引用。
- rvalue可以影响函数重载:当被用作函数实参且该函数有两种重载可用,其中之一接收右值引用的形参而另一个接收const的左值引用的形参时,右值将绑定到右值引用的重载上。
九、深入
通过一些例子来加深对左值和右值的理解。
9.1 前置自增(减)是左值,后置自增(减)是纯右值
代码如下:
int i = 0; ++i; --i; i++; i--;
上面代码中,我们定义了一个int类型的变量i,并初始化为0。
- ++i的操作是对i加1后再赋给i,所以++i对结果是具名的,名称就是i,所以++i是左值。
- 对于i++而言,先将i的值进行拷贝(此处假设拷贝到临时变量ii),然后再对i加1,最后返回ii(其实是不存在的,为了在此处表述方便)。所以i++是不具名的,因此不是glvalue,所以i++是右值,有因为不具名,且是右值,所以i++是纯右值。
- 同理,--i是左值,i--是纯右值。
9.2算术表达式是纯右值
代码如下:
int x = 0; int y = 0; x + y; x && y; x == y;
上述代码中,x+y得到 的是一个不具名的临时对象,所以x+y是纯右值;而x&&y和x==y得到的是一个bool常量值,要么是true要么是false,所以是纯右值。
9.3 解引用是左值,取地址是纯右值
代码如下:
int x = 0; int *y = &x; *y = 1; &y;
*y得到的是y指向地址的实际值,所以&(*y)是合法的,因此*y是左值;对于&y操作得到的是一个地址,即一个long值,所以是一个字面值,因此&y是纯右值。
9.4 字符串字面值是左值
字符串字面值为左值,这个比较特殊。在前面提到过字面值都是纯右值(字符串字面值除外),一个很重要的原因,就是字符串字面值可用取地址。
下面代码在编译器中可用正常编译且运行:
std::cout << &"abc" << std::endl;
0x10000b569
这是因为C++将字符串字面值实现为char型数组,实实在在地为每一个字符都分配了空间并且允许程序员对其进行操作。如果从存储区的概念来理解,那就是字符串字面值存储在常量区。
10、引用
C++11之前,引用分为左值引用和常量左值引用两种,但是自C++11起,引入了右值引用,也就是说,在C++11中,包含如下3种引用:
- 左值引用
- 常量左值引用(不希望被修改)
- 右值引用
左值引用和常量左值引用很常见:
std::string str = "abc"; std::string &s = str; const int &a = 10; int &b = 10; // 错
上述代码中,s是一个左值引用,而a是一个const左值引用。那么,为什么最后一句int&b=10;编译器报错呢?这是因为10是常量,而常量是右值,一个右值怎么能被左值引用去引用呢。
在C++11中引入了右值引用,因为右值的生命周期很短,右值引用的引入,使得可以延长右值的生命周期。在C++中规定,右值引用是&&即由2个&表示,而左值引用是一个& 表示。右值引用的作用是为了绑定右值。
为了能区分左值引用和右值引用,代码如下:
int a = 1; int &rb = a; // b为左值引用 int &&rrb = a; // 错误,a是左值,右值引用不能绑定左值 int &&rrb1 = 1; // 正确,1为右值 int &rb1 = i * 2; // 错误,i * 2是右值,而rb1位左值引用 int &&rrb2 = i * 2; // 正确 const int &c = 1; // 正确 const int &c1 = i * 2; // 正确
这里,需要注意的一点就是右值引用虽然是引用右值,但是其本身是左值。以下代码为例:
int &&a = 1;
上述代码中,a是一个右值引用,但其本身是左值,因为:
- a出现在等号的左边。
- 可以对a取地址
前面有提到过,一个表达式有两个属性,分别为类型和值类别。本节说的左值引用和右值引用属于类型,而左值和右值属于值类别范畴,这个概念很重要,不能混淆。
C++11 提供了API来快速区分左值引用和右值引用:
std::is_lvalue_reference is_rvalue_reference int a = 1; int &ra = a; int &&b = 1; std::cout << std::is_lvalue_reference<decltype(ra)>::value << std::endl; std::cout << std::is_rvalue_reference<decltype(ra)>::value << std::endl; std::cout << std::is_rvalue_reference<decltype(b)>::value << std::endl;
输出:
1 0 1