都说 C++ 没有 GC,RAII: 那么我算个啥?
*以下内容为本人的学习笔记,如需要转载,请声明原文链接 微信公众号「ENG八戒」https://mp.weixin.qq.com/s/7A9-tGZxf4w_7eZl3OUQ4A
学过 Java、C# 或者其他托管语言(managed languages)的同学,回过头来看 C++ 的时候,第一反应就是 C++ 没有自动垃圾回收器(GC),而不能充分利用的资源被称为垃圾。
那么 C++ 真的不能自动回收垃圾吗?带着这个疑问我们来看看一般 C++ 程序都是怎样回收资源的。
内存在计算机系统中是有限的资源,通常申请内存和释放内存是这样子的,假设有个被调用的函数 function():
void function()
{
int *p = new int; // 申请内存
// 资源申请下来了,不玩有个 p 用?
// do something
delete p; // 释放内存
}
这段示例代码在 function() 函数开始的时候申请了一块内存,大小对应于 int 类型,然后在函数结束的时候释放它。通常来说,这看起来很OK,没毛病,但是,如果遇到了下面几种情况呢?
- 程序如果中途有逻辑让它提前退出 function() 函数
- 发生了异常而没有被捕获到
那么在函数尾部执行释放内存的动作有几率不会被执行,意味着发生也会内存泄漏。像上面这段代码,如果调用的次数不多也不碍事,不过,如果循环调用 function(),这时泄露的内存资源会不断累积,而且一直被浪费掉,期间系统无法再次使用这些被浪费的内存,直到进程被终止,严重的话,会导致系统资源被耗尽,跑着跑着系统都崩溃了。这种 bug 在 C 范式的编程语言中真的很常见。
RAII 是什么
众所周知 C++ 具有面向对象的特性,在初始化类对象的时候,系统会调用类构造函数。如果类对象是存放在栈空间的话,比如声明为局部变量,那么当类对象超出生命周期时,比如退出局部变量的作用域,系统会调用这个对象的类析构函数;如果类对象是存放在堆空间的话,比如通过 new 操作符创建的类对象,那么当类对象被销毁时,比如对对象执行 delete 操作,系统同样会调用类析构函数。
C++ 的这个特性可以用来解决上面提到的资源泄露问题,怎么利用呢?
modern C++ 实践建议优先把资源存放在栈上。如果只是个变量类型,完全可以用局部变量的形式定义声明,这样代码块在退出后系统自动回收栈上的资源。
对上面的函数 function() 修改
void function()
{
// 声明定义为局部变量,资源存储在栈区
int data = 0;
// do something with data
// 函数退出时,自动释放 data 占用的空间
}
当资源比较占空间时,需要在堆上分配资源,可以通过指针引用它,资源的申请放在类的构造函数里,然后在析构函数里释放。下面举个例子
class Helper
{
private:
int* data;
public:
Helper() {
data = new int; // 在堆上申请内存
}
~Helper() {
delete data; // 释放堆上申请的内存
}
void do_something_with_data() {}
};
void function()
{
// 声明定义为局部变量,对象存储在栈区
// 调用 Helper 类构造函数在堆上申请资源
Helper help;
// 通过对象 help 调用成员 data
// 如果 data 是 Helper 私有成员
// 在类外面必须通过类成员方法调用 data
help.do_something_with_data();
// 函数退出时,自动释放 help 对象占用的栈空间
// 就算发生了异常或者中途退出都会执行这一步
// help 对象被销毁时,调用 Helper 类析构函数
// Helper 类析构函数释放已申请的堆上资源
}
利用这种特性的行为被 C++ 发明人称呼为 RAII,英文全称是「resource acquisition is initialization」,中文翻译过来是「资源获取即是初始化」。而我喜欢把它叫做上下文管理,实现资源申请释放的类叫做上下文管理器(context manager)。
经典实践--智能指针
上面的示例代码写起来略显啰嗦,为了推广这种设计核心思路和简化代码编写,在 C++ 11 之后标准库里添加了 unique_ptr。
unique_ptr 属于 Smart Points 中的一种,Smart Points 在国内通常翻译为「智能指针」。智能指针负责管理和释放资源。上面的 function() 函数可以改成这样子
#include <memory>
void function()
{
// 实例化智能指针对象,输入需要被管理的内存首地址
// 对象为局部变量,存储在栈区
std::unique_ptr<int> data(new int);
// 智能指针对象就像普通指针一样调用
printf("data=%d\n", *data);
// 函数退出时,自动释放 data 对象占用的栈空间
// 就算发生了异常或者中途退出都会执行这一步
// data 对象被销毁时,同步释放被管理的内存资源
}
可见,用了智能指针后,不需要像之前那样定义类 Helper (上下文管理器)了,代码清爽很多。
不过,上面的示例代码中有个地方需要注意,在实例化智能指针对象时必须传入内存地址,有没有其它更好的方式设置被管理的内存地址?
有的,C++ 14 之后标准库添加了 make_unique,演示一下怎么用
std::unique_ptr<int> data = std::make_unique<int>();