C++ std::thread join()的理解
在学习C++11的std::thread时,起初非常不理解join()函数的作用以及使用场景,官方的解释又比较晦涩难懂,总觉得get不到关键点。看了很多文章后加上自己的理解,才觉得有了一点眉目,下面结合场景记录一下自己的浅见。
在简单的程序中一般只需要一个线程就可以搞定,也就是主线程:
int main() { cout << "主线程开始运行\n"; }
现在假设我要做一个比较耗时的工作,从一个服务器下载一个视频并进行处理,那么我的代码会变成:
int main() { cout << "主线程开始运行\n"; download(); // 下载视频到本地 process(); // 本地处理 }
如果我需要两个视频素材一起在本地进行处理,也很简单:
int main() { cout << "主线程开始运行\n"; download1(); // 下载视频1 download2(); // 下载视频2 process(); // 一起处理一下 }
本身这么做完全没有问题,可是就是有点浪费时间,如果两个视频能够同时下载就好了,这时候线程就派上了用场:
void download1() { cout << "开始下载第一个视频..." << endl; for (int i = 0; i < 100; ++i) { std::this_thread::sleep_for(std::chrono::milliseconds(50)); cout << "下载进度:" << i << endl; } cout << "第一个视频下载完成..." << endl; } void download2() { cout << "开始下载第二个视频..." << endl; for (int i = 0; i < 100; ++i) { std::this_thread::sleep_for(std::chrono::milliseconds(30)); cout << "下载进度:" << i << endl; } cout << "第二个视频下载完成..." << endl; } int main() { cout << "主线程开始运行\n"; std::thread d2(download2); download1(); process(); }
主线程叫来了d2这个线程去下载第二个视频,自己去下载第一个视频,减轻了自己的工作量也缩短了时间,仔细看一下download2()中的sleep可以发现,两个视频同时下载肯定是视频二先下载完,这样在主线程下载完视频一的时候视频二已经准备好了,后面就可以一起进行处理,没什么问题,但是万一视频二的下载时间比视频一的时间长呢?当视频一下载完了,d2还没干完活,本地还没有视频二,接下来处理的时候肯定会有问题,或者说接下来不能直接进行处理,要等d2干完活后,主线程才能去处理两个视频。
在这种场景下就用到了join()这个函数。
先贴一下关于join()函数的解释:
The function returns when the thread execution has completed.This synchronizes the moment this function returns with the completion of all the operations in the thread: This blocks the execution of the thread that calls this function until the function called on construction returns (if it hasn't yet).
总结理解一下就是两个关键点:
- 谁调用了这个函数?调用了这个函数的线程对象,一定要等这个线程对象的方法(在构造时传入的方法)执行完毕后(或者理解为这个线程的活干完了!),这个join()函数才能得到返回。
- 在什么线程环境下调用了这个函数?上面说了必须要等线程方法执行完毕后才能返回,那必然是阻塞调用线程的,也就是说如果一个线程对象在一个线程环境调用了这个函数,那么这个线程环境就会被阻塞,直到这个线程对象在构造时传入的方法执行完毕后,才能继续往下走,另外如果线程对象在调用join()函数之前,就已经做完了自己的事情(在构造时传入的方法执行完毕),那么这个函数不会阻塞线程环境,线程环境正常执行。
接下来修改代码并结合起来解释一下:
1 void download1() 2 { 3 cout << "开始下载第一个视频..." << endl; 4 for (int i = 0; i < 100; ++i) { 5 std::this_thread::sleep_for(std::chrono::milliseconds(50)); 6 cout << "第一个视频下载进度:" << i << endl; 7 } 8 cout << "第一个视频下载完成..." << endl; 9 } 10 11 void download2() 12 { 13 cout << "开始下载第二个视频..." << endl; 14 for (int i = 0; i < 100; ++i) { 15 std::this_thread::sleep_for(std::chrono::milliseconds(80)); 16 cout << "第二个视频下载进度:" << i << endl; 17 } 18 cout << "第二个视频下载完成..." << endl; 19 } 20 void process() 21 { 22 cout << "开始处理两个视频" << endl; 23 } 24 25 int main() 26 { 27 cout << "主线程开始运行\n"; 28 std::thread d2(download2); 29 download1(); 30 d2.join(); 31 process(); 32 }
现在下载视频1需要5秒,下载视频2需要8秒,当视频1下载完成后要等待视频2下载完成才能一起进行处理,为了实现这个目的我们在30行只加入了一行代码d2.join()。
在这个场景下,我们明确两个事情:
- 谁调用了join()函数?d2这个线程对象调用了join()函数,因此必须等待d2的下载任务结束了,d2.join()函数才能得到返回。
- d2在哪个线程环境下调用了join()函数?d2是在主线程的环境下调用了join()函数,因此主线程要等待d2的线程工作做完,否则主线程将一直处于block状态;这里不要搞混的是d2真正做的任务(下载)是在另一个线程做的,但是d2调用join()函数的动作是在主线程环境下做的。
以上是结合具体场景分析join()函数的使用方法和用途,为了便于理解有些啰嗦了,当然实际中join()应该会有很多的用法和学问,先了解一下作为入门铺垫吧。