浅墨浓香

想要天亮进城,就得天黑赶路。

导航

第25课 std::thread对象的析构

Posted on 2019-10-12 10:34  浅墨浓香  阅读(6771)  评论(0编辑  收藏  举报

一. 线程的等待与分离

(一)join和detach函数

  1. 线程等待:join()

  (1)等待子线程结束,调用线程处于阻塞模式

  (2)join()执行完成之后,底层线程id被设置为0,即joinable()变为false。同时会清理线程相关的存储部分, 这样 std::thread 对象将不再与已经底层线程有任何关联。这意味着,只能对一个线程使用一次join();调用join()后,joinable()返回false。

  2. 线程分离:detach()

  (1)分离子线程,与当前线程的连接被断开,子线程成为后台线程,被C++运行时库接管。这意味着不可能再有std::thread对象能引用到子线程了。与join一样,detach也只能调用一次,当detach以后其joinable()为false

  (2)注意事项:

    ①如果不等待线程,就必须保证线程结束之前,可访问的数据是有效的。特别是要注意线程函数是否还持有一些局部变量的指针或引用

    ②为防止上述的悬空指针和悬引用的问题,线程对象的生命期应尽量长于底层线程的生命期

  (3)应用场合

    ①适合长时间运行的任务,如后台监视文件系统、对缓存进行清理、对数据结构进行优化等。

    ②线程被用于“发送即不管”(fire and forget)的任务,任务完成情况线程并不关心,即安排好任务之后就不管。

(二)联结状态:一个std::thread对象只可能处于可联结或不可联结两种状态之一可用joinable()函数来判断,即std::thread对象是否与某个有效的底层线程关联(内部通过判断线程id是否为0来实现)。

  1. 可联结(joinable):当线程可运行、己运行或处于阻塞时是可联结的。注意,如果某个底层线程已经执行完任务但是没有被join的话,该线程依然会被认为是一个活动的执行线程,仍然处于joinable状态

  2. 不可联结(unjoinable):

  (1)当不带参构造的std::thread对象为不可联结,因为底层线程还没创建。

  (2)己移动的std::thread对象为不可联结。因为该对象的底层线程id会被设置为0。

  (3)己调用join或detach的对象为不可联结状态。因为调用join()以后,底层线程己结束,而detach()会把std::thread对象和对应的底层线程之间的连接断开。

【编程对象】等待与分离

#include <iostream>
#include <thread>

using namespace std;

//1. 悬空引用问题
class FuncObject
{
    void do_something(int& i) { cout <<"do something: " << i << endl; }
public:
    int& i;
    FuncObject(int& i) :i(i) {  }

    void operator()()
    {
        for (unsigned int j = 0; j < 1000; ++j)
        {
            do_something(i); //可能出现悬空引用的问题。
        }
    }
};

void oops()
{
    int localVar = 0;
    FuncObject fObj(localVar);

    std::thread t1(fObj);

    t1.detach();  //子线程分离,转为后台运行。主线程调用oops函数,可能出现oops函数
                  //执行完了,子线程还在运行的现象。它会去调用do_something,这时会
                  //访问到己经被释放的localVar变量,会出现未定义行为!如果这里改成
                  //join()则不会发生这种现象。因此主线程会等子线程执行完才退出oops
}


//2. 利用分离线程处理多文档文件
void openDocAndDisplay(const std::string& fileName){} //打开文件
bool doneEditing() { return false; } //判断是否结束编辑
enum class UserCommand{OpenNewDocument, SaveDocument,EditDocument}; //命令类型
UserCommand getUserInput() { return UserCommand::EditDocument; } //获取用户命令
string getFilenameFromUser() { return ""; } //获取文件名
void processUserInput(UserCommand cmd){} //处理其它命令

void editDocument(const std::string& fileName) 
{
    openDocAndDisplay(fileName);

    while (!doneEditing()) {
        UserCommand cmd = getUserInput();
        if (cmd == UserCommand::OpenNewDocument) { //如果用户选择打开一个新文档
            const string  newName = getFilenameFromUser();
            std::thread t(editDocument, newName);  //启动新线程去处理这个新文档

            t.detach(); //子线程分离。这样主线程就可以继续处理其他任务。
        }else {
            processUserInput(cmd);
        }
    }
}

int main()
{
    //1. 悬空引用问题
    oops();

    //2. 利用分离线程处理多文档文件
    editDocument("E:\\Demo\\abc.doc");
    return 0;
}

二. std::thread对象的析构

(一)std::thread的析构

  1. std::thread对象析构时,会先判断joinable(),如果可联结,则程序会直接被终止(terminate)

  2. 这意味std::thread对象从其它定义域出去的任何路径,都应为不可联结状态。也意味着创建thread对象以后,要在随后的某个地方显式地调用join或detach以便让std::thread处于不可联结状态。

(二)为什么析构函数中不隐式调用join或detach

  1. 如果设计成隐式join():将导致调用线程一直等到子线程结束才返回。如果子线程正在运行一个耗时任务,这可能造成性能低下的问题,而且问题也不容易被发现

  2. 如果设计成隐式detach():由于detach会将切断std::thread对象与底层线程之间的关联,两个线程从此各自独立运行。如果线程函数是按引用(或指针)方式捕捉的变量,在调用线程退出作用域后这些变量会变为无效,这容易掩盖错误也将使调试更加困难。因此隐式detach,还不如join或者显式调用detach更直观和安全。

  3.标准委员会认为,销毁一个joinable线程的后果是十分可怕的,因此他们通过terminate程序来禁止这种行为。为了避免销毁一个joinable的线程,就得由程序员自己来确保std::thread对象从其定义的作用域出去的任何路径,都处于不可联结状态,最常用的方法就是资源获取即初始化技术RAII,Resource Acquisition Is Initialization)。

(三)std::thread对象与RAII技术的结合

  1. 方案1:自定义的thread_guard类,并将std::thread对象传入其中,同时在构造时选择join或detach策略。当thread_guard对象析构时,会根据析构策略,调用std::thread的join()或detach(),确保在任何路径,线程对象都处于unjoinable状态。

  2. 方案2:重新封装std::thread类(见下面的代码,类名为joining_thread),在析构时隐式调用join()。

【编程实验】利用RAII确保std::thread所有路径皆为unjoinable

#include <iostream>
#include <thread>
#include <functional>
#include <algorithm>

using namespace std;

constexpr auto tenMillion = 10000000;

bool conditionsAreSatisfied() { return false;}//return true or false

//问题函数:doWork_oops(没有确保std::thread所有皆为不可联结)
//参数:filter过滤器,选0至maxVal之间的值选择出来并放入vector中
bool doWork_oops(std::function<bool(int)> filter, int maxVal = tenMillion)
{
    std::vector<int> goodVals; //保存经过滤器筛选出来的数值(0-maxVal)

    std::thread t([&filter, maxVal, &goodVals] { //注意goodVals是局部变量,按引用传入子线程。
                    for (auto i = 0; i <= maxVal; ++i)
                        if (filter(i))  goodVals.push_back(i);
                });

    if (conditionsAreSatisfied()) { //如果一切就绪,就开始计算任务
        t.join(); //等待子线程结束
        //performComputation(goodVals);  //主线程执行计算任务
        return true;
    }

    //conditionsAreSatisfied()时false,表示条件不满足。(注意,仍没调用join()或detach())
    return  false; //调用线程(一般是主线程)执行到这里,t对象被析构,std::thread的析构函数被调用,
                   //此时由于子线程仍处于可联结状态,将执行std::ternimate终止程序!
                   //为什么std::thread析构函数不隐式执行join或detach,而是终止程序的运行?
                   //如果隐式调用join()会让主线程等待子线程(耗时任务)结束,这会浪费性能。
                   //而如果隐式调用detach会使主线程和子线程分离,子线程由于引用goodVals局部变量,
                   //会出现悬空引用的问题,但这问题又不容易被发现。因此,通过std::ternimate来终止
                   //程序,以便让程序员自己决定和消除这些问题。比如继续调用join(),还是detach(但需
                   //要同时解决悬空引用问题)?
}

//利用RAII技术,确保std::thread的正常析构
class thread_guard  //scoped_thread
{
public:
    enum class DtorAction{join, detach}; //析构行为

    //构造函数只接受右值类型,因为std::thread只能被移动。虽然t为右值引用类型,但由于形参本身
    //左值,因此调用std::move将形参转为右值。
    thread_guard(std::thread&& t, DtorAction a = DtorAction::join):action(a), thr(std::move(t))
    {
    }

    ~thread_guard()
    {
        if (thr.joinable()) //必须校验,join和detach只能被调用一次
        {
            if (action == DtorAction::join) {
                thr.join();
            } else {
                thr.detach();
            }
        }
    }

    std::thread& get() { return thr; }

    //由于声明了析构函数,编译器将不再提供移动操作函数,因此需手动生成
    thread_guard(thread_guard&&) noexcept = default;
    thread_guard& operator=(thread_guard&&) = default;

    //本类不支持复制
    thread_guard(const thread_guard&) = delete;
    thread_guard& operator=(const thread_guard&) = delete;
private:

    //注意action和thr的声明顺序,由于thr被创建以后会执行起来,必须
    //保证action己被初始化。因此先声明action,再声明thr。
    DtorAction action;
    std::thread thr;
};

bool doWork_ok(std::function<bool(int)> filter, int maxVal = tenMillion)
{
    std::vector<int> goodVals;

    std::thread t([&filter, maxVal, &goodVals] { //注意goodVals是局部变量,按引用传入子线程。
        for (auto i = 0; i <= maxVal; ++i)
            if (filter(i)) 
            { 
                cout << i << endl;
                goodVals.push_back(i); 
            }
        });

    thread_guard guard(std::move(t));//默认析构策略是thread_guard::DtorAction::join

    if (conditionsAreSatisfied()) { //如果一切就绪,就开始计算任务
        guard.get().join(); //等待子线程结束
        //performComputation(goodVals);  //主线程执行计算任务
        return true;
    }

    //conditionsAreSatisfied()时false,表示条件不满足。guard对象析构,但会隐式调std::thread对象
    //的join()。
    return  false;
}

//使用RAII等待线程完成:joining_thread类的实现
class joining_thread
{
    std::thread thr;
public:
    joining_thread() noexcept = default;

    //析构函数
    ~joining_thread()
    {
        if (joinable()) //对象析构造,会隐式调用join()
        {
            join();
        }
    }

    template<typename Callable, typename... Args>
    explicit joining_thread(Callable&& func, Args&& ...args):
        thr(std::forward<Callable>(func), std::forward<Args>(args)...)
    {
    }

    //类型转换构造函数
    explicit joining_thread(std::thread t) noexcept : thr(std::move(t))
    {
    }

    //移动操作
    joining_thread(joining_thread&& other) noexcept : thr(std::move(other.thr))
    {
    }

    joining_thread& operator=(joining_thread&& other) noexcept
    {
        if (joinable()) join(); //等待原线程执行完

        thr = std::move(other.thr); //将新线程移动到thr中

        return *this;
    }

    joining_thread& operator=(std::thread other) noexcept
    {
        if (joinable()) join();

        thr = std::move(other);

        return *this;
    }
    
    bool joinable() const noexcept
    {
        return thr.joinable();
    }

    void join() { thr.join(); }
    void detach() { thr.detach(); }

    void swap(joining_thread& other) noexcept { thr.swap(other.thr); }
    std::thread::id get_id() const noexcept { return thr.get_id(); }

    std::thread& asThread() noexcept //转化为std::thread对象
    {
        return thr;
    }
    const std::thread& asThread() const noexcept
    {
        return thr;
    }
};

void doWork(int i) { cout << i << endl; }

int main()
{
    //1.问题函数:doWork_oops:没有确保std::thread的所有路径都为joinable
    //doWork_oops([](auto val) { return val >= 100; }, 1000);

    //2. doWork_ok函数
    doWork_ok([](auto val) { return val >= 100; }, 1000);

    //3. 测试joining_thread类
    std::vector<joining_thread> threads;  //joining_thread析构时隐式调用join
    for (unsigned int i = 0; i < 20; ++i) {
        threads.push_back(joining_thread(doWork, i));
    }

    std::for_each(threads.begin(), threads.end(), std::mem_fn(&joining_thread::join));

    return 0;
}