boost库之多线程(四)

一、线程管理

在这个库最重要的一个类就是 boost::thread，它是在 boost/thread.hpp 里定义的，用来创建一个新线程。下面的示例来说明如何运用它：

#include <boost/thread.hpp> 
#include <string> 
#include <iostream> 

void wait(int seconds) {
    boost::this_thread::sleep(boost::posix_time::seconds(seconds));
}

void thread() {
    for (int i = 0; i < 5; ++i) {
        wait(2);
        std::cout << i << std::endl;
    }
}

int main() {
    boost::thread t(thread);
    t.join();

    return 1;
}

新建线程里执行的那个函数的名称被传递到 boost::thread 的构造函数。一旦上述示例中的变量 t 被创建，该 thread() 函数就在其所在线程中被立即执行。同时在 main() 里也并发地执行该 thread() 。

为了防止程序终止，就需要对新建线程调用 join() 方法。 join() 方法是一个阻塞调用：它可以暂停当前线程，直到调用 join() 的线程运行结束。这就使得 main() 函数一直会等待到 thread() 运行结束。

正如在上面的例子中看到，一个特定的线程可以通过诸如 t 的变量访问，通过这个变量等待着它的使用 join() 方法终止。但是，即使 t 越界或者析构了，该线程也将继续执行。一个线程总是在一开始就绑定到一个类型为 boost::thread 的变量，但是一旦创建，就不在取决于它。甚至还存在着一个叫 detach() 的方法，允许类型为 boost::thread 的变量从它对应的线程里分离。当然了，像 join() 的方法之后也就不能被调用，因为这个变量不再是一个有效的线程。

任何一个函数内可以做的事情也可以在一个线程内完成。归根结底，一个线程只不过是一个函数，除了它是同时执行的。在上述例子中，使用一个循环把5个数字写入标准输出流。为了减缓输出，每一个循环中调用 wait() 函数让执行延迟了一秒。 wait() 可以调用一个名为 sleep() 的函数，这个函数也来自于 Boost.Thread，位于 boost::this_thread 名空间内。

sleep() 要么在预计的一段时间或一个特定的时间点后时才让线程继续执行。通过传递一个类型为 boost::posix_time::seconds 的对象，在这个例子里我们指定了一段时间。 boost::posix_time::seconds 来自于 Boost.DateTime 库，它被 Boost.Thread 用来管理和处理时间的数据。

前面的例子说明了如何等待一个不同的线程，但下面的例子演示了如何通过所谓的中断点让一个线程中断：

#include <boost/thread.hpp> 
#include <iostream> 

void wait(int seconds) {
    boost::this_thread::sleep(boost::posix_time::seconds(seconds));
}

void thread()
{
    try {
        for (int i = 0; i < 5; ++i) {
            wait(1);
            std::cout << i << std::endl;
        }
    }
    catch (boost::thread_interrupted&) {
        std::cout << "boost::thread_interrupted" << std::endl;
    }
}

int main()
{
    boost::thread t(thread);
    wait(3);
    t.interrupt();
    t.join();

    return 1;
}

打印结果：

在一个线程对象上调用 interrupt() 会中断相应的线程。在这方面，中断意味着一个类型为 boost::thread_interrupted 的异常，它会在这个线程中抛出。然后这只有在线程达到中断点时才会发生。

如果给定的线程不包含任何中断点，简单调用 interrupt() 就不会起作用。每当一个线程中断点，它就会检查 interrupt() 是否被调用过。只有被调用过了， boost::thread_interrupted 异常才会相应地抛出。

Boost.Thread定义了一系列的中断点，例如 sleep() 函数。由于 sleep() 在这个例子里被调用了五次，该线程就检查了五次它是否应该被中断。然而 sleep() 之间的调用，却不能使线程中断。

一旦该程序被执行，它只会打印三个数字到标准输出流。这是由于在main里3秒后调用 interrupt()方法。因此，相应的线程被中断，并抛出一个 boost::thread_interrupted 异常。这个异常在线程内也被正确地捕获， catch 处理虽然是空的。由于 thread() 函数在处理程序后返回，线程也被终止。这反过来也将终止整个程序，因为 main() 等待该线程使用join（）终止该线程。

Boost.Thread定义包括上述 sleep()函数十个中断。有了这些中断点，线程可以很容易及时中断。然而，他们并不总是最佳的选择，因为中断点必须事前读入以检查 boost::thread_interrupted 异常。

为了提供一个对 Boost.Thread 里提供的多种函数的整体概述，下面的例子将会再介绍两个:

#include <boost/thread.hpp> 
#include <iostream> 

int main() {
    std::cout << boost::this_thread::get_id() << std::endl;
    std::cout << boost::thread::hardware_concurrency() << std::endl;

    return 1;
}

使用 boost::this_thread命名空间，能提供独立的函数应用于当前线程，比如前面出现的 sleep() 。另一个是 get_id()：它会返回一个当前线程的ID号。它也是由 boost::thread 提供的。

boost::thread 类提供了一个静态方法 hardware_concurrency() ，它能够返回基于CPU数目或者CPU内核数目的刻在同时在物理机器上运行的线程数。在常用的双核机器上调用这个方法，返回值为2。这样的话就可以确定在一个多核程序可以同时运行的理论最大线程数。

二、线程同步

#include <boost/thread.hpp> 
#include <iostream> 

boost::mutex mutex;

void wait(int seconds) {
    boost::this_thread::sleep(boost::posix_time::seconds(seconds));
}

void thread() {
    for (int i = 0; i < 5; ++i) {
        wait(1);
        mutex.lock();
        std::cout << "Thread " << boost::this_thread::get_id() << ": " << i << std::endl;
        mutex.unlock();
    }
}

int main() {
    boost::thread t1(thread);
    boost::thread t2(thread);
    t1.join();
    t2.join();

    return 1;
}

打印结果：

多线程程序使用所谓的互斥对象来同步。 Boost.Thread提供多个的互斥类，boost::mutex是最简单的一个。互斥的基本原则是当一个特定的线程拥有资源的时候防止其他线程夺取其所有权。一旦释放，其他的线程可以取得所有权。这将导致线程等待至另一个线程完成处理一些操作，从而相应地释放互斥对象的所有权。

上面的示例使用一个类型为 boost::mutex 的 mutex 全局互斥对象。 thread() 函数获取此对象的所有权才在 for 循环内使用 lock() 方法写入到标准输出流的。一旦信息被写入，使用 unlock() 方法释放所有权。

main() 创建两个线程，同时执行 thread ()函数。利用 for 循环，每个线程数到5，用一个迭代器写一条消息到标准输出流。不幸的是，标准输出流是一个全局性的被所有线程共享的对象。该标准不提供任何保证 std::cout 可以安全地从多个线程访问。因此，访问标准输出流必须同步：在任何时候，只有一个线程可以访问 std::cout。

由于两个线程试图在写入标准输出流前获得互斥体，实际上只能保证一次只有一个线程访问 std::cout。不管哪个线程成功调用 lock() 方法，其他所有线程必须等待，直到 unlock() 被调用。

获取和释放互斥体是一个典型的模式，是由Boost.Thread通过不同的数据类型支持。例如，不直接地调用 lock() 和 unlock()，使用 boost::lock_guard 类也是可以的，boost::lock_guard是Boost库中的一个类，用于实现互斥锁的自动管理。它提供了一种方便的方式，在进入代码块时获取互斥锁，而在离开代码块时自动释放互斥锁，以确保互斥锁的正确使用和避免资源竞争。下面是使用boost::lock_guard 的示例：

#include <boost/thread.hpp> 
#include <iostream> 

boost::mutex mutex;

void wait(int seconds) {
    boost::this_thread::sleep(boost::posix_time::seconds(seconds));
}

void thread() {
    for (int i = 0; i < 5; ++i)
    {
        wait(1);
        boost::lock_guard<boost::mutex> lock(mutex); // 创建lock_guard对象，自动获取互斥锁
        std::cout << "Thread " << boost::this_thread::get_id() << ": " << i << std::endl; // 在这个代码块中可以安全地访问需要保护的共享资源
    } // lock_guard对象超出作用域，自动释放互斥锁
}

int main() {
    boost::thread t1(thread);
    boost::thread t2(thread);
    t1.join();
    t2.join();

    return 1;
}

打印结果：

除了boost::mutex 和 boost::lock_guard 之外，Boost.Thread也提供其他的类支持各种同步。其中一个重要的就是 boost::unique_lock ，boost::unique_lock是Boost库中的一个类，用于实现更灵活的互斥锁管理。与boost::lock_guard相比，boost::unique_lock提供了更多的功能和配置选项。相比较 boost::lock_guard 而言，它提供许多有用的方法。

#include <boost/thread.hpp> 

boost::mutex mutex;  // 创建一个互斥锁

void someFunction()
{
    boost::unique_lock<boost::mutex> lock(mutex);  // 创建unique_lock对象，自动获取互斥锁

    // 在这个代码块中可以安全地访问需要保护的共享资源

    lock.unlock();  // 可以手动释放互斥锁，但仍保持unique_lock对象的所有权

    // 在这里可以执行一些不需要互斥锁保护的操作

    lock.lock();  // 重新获取互斥锁

    // 再次安全地访问需要保护的共享资源

}  // unique_lock对象超出作用域，自动释放互斥锁

在上面的示例中，我们创建了一个boost::mutex对象 mutex，它是一个互斥锁。然后，在函数 someFunction() 中，我们创建了一个 boost::unique_lock 对象 lock，并将 mutex 作为参数传递给它。这样，在 lock 对象的作用域内，互斥锁将会被自动获取，保护了需要保护的共享资源。可以使用 lock.unlock() 手动释放互斥锁，但是仍然保持 unique_lock 对象的所有权。这样，我们可以在不需要互斥锁保护的代码段中执行一些操作。然后，使用 lock.lock() 重新获取互斥锁，继续安全地访问需要保护的共享资源。一旦 lock 对象超出作用域，它会自动释放互斥锁。

boost::unique_lock相比于boost::lock_guard的优势在于其更高的灵活性，例如：

可以手动释放互斥锁，并在需要时重新获取。
可以在构造unique_lock对象时选择不获取互斥锁，以便稍后手动获取。
可以指定不同的锁策略，如defer_lock延迟获取锁、try_to_lock尝试获取锁等。
支持对多个互斥锁进行上锁和解锁，实现更复杂的锁定机制。

这些功能使得boost::unique_lock在一些需要更灵活互斥锁管理的场景中非常有用。

#include <boost/thread.hpp> 
#include <iostream> 

boost::timed_mutex mutex;

void wait(int seconds) {
    boost::this_thread::sleep(boost::posix_time::seconds(seconds));
}

void thread() {
    for (int i = 0; i < 5; ++i) {
        wait(1);
        boost::unique_lock<boost::timed_mutex> lock(mutex, boost::try_to_lock);
        if (!lock.owns_lock())
            lock.timed_lock(boost::get_system_time() + boost::posix_time::seconds(1));
        std::cout << "Thread " << boost::this_thread::get_id() << ": " << i << std::endl;
        boost::timed_mutex* m = lock.release();
        m->unlock();
    }
}

int main() {
    boost::thread t1(thread);
    boost::thread t2(thread);
    t1.join();
    t2.join();

    return 1;
}

打印结果：

上面的例子用不同的方法来演示 boost::unique_lock 的功能。当然了，这些功能的用法对给定的情景不一定适用；boost::lock_guard 在上个例子的用法还是挺合理的。这个例子就是为了演示 boost::unique_lock 提供的功能。

boost::unique_lock 通过多个构造函数来提供不同的方式获得互斥体。这个期望获得互斥体的函数简单地调用了 lock() 方法，一直等到获得这个互斥体。所以它的行为跟 boost::lock_guard 的那个是一样的。

如果第二个参数传入一个 boost::try_to_lock 类型的值，对应的构造函数就会调用 try_lock() 方法。这个方法返回 bool 型的值：如果能够获得互斥体则返回true，否则返回 false 。相比 lock() 函数，try_lock() 会立即返回，而且在获得互斥体之前不会被阻塞。

上面的程序向 boost::unique_lock 的构造函数的第二个参数传入boost::try_to_lock。然后通过 owns_lock() 可以检查是否可获得互斥体。如果不能， owns_lock() 返回 false。这也用到 boost::unique_lock 提供的另外一个函数： timed_lock() 等待一定的时间以获得互斥体。给定的程序等待长达1秒，应较足够的时间来获取更多的互斥。

其实这个例子显示了三个方法获取一个互斥体：lock() 会一直等待，直到获得一个互斥体。 try_lock() 则不会等待，但如果它只会在互斥体可用的时候才能获得，否则返回 false 。最后，timed_lock() 试图获得在一定的时间内获取互斥体。和 try_lock() 一样，返回bool 类型的值意味着成功是否。

虽然 boost::mutex 提供了 lock() 和 try_lock() 两个方法，但是 boost::timed_mutex 只支持 timed_lock() ，这就是上面示例那么使用的原因。如果不用 timed_lock() 的话，也可以像以前的例子那样用 boost::mutex。

就像 boost::lock_guard 一样， boost::unique_lock 的析构函数也会相应地释放互斥量。此外，可以手动地用 unlock() 释放互斥量。也可以像上面的例子那样，通过调用 release() 解除boost::unique_lock 和互斥量之间的关联。然而在这种情况下，必须显式地调用 unlock() 方法来释放互斥量，因为 boost::unique_lock 的析构函数不再做这件事情。

boost::unique_lock 这个所谓的独占锁意味着一个互斥量同时只能被一个线程获取。其他线程必须等待，直到互斥体再次被释放。除了独占锁，还有非独占锁。 Boost.Thread里有个 boost::shared_lock 的类提供了非独占锁。正如下面的例子，这个类必须和 boost::shared_mutex 型的互斥量一起使用。boost::shared_loc用于实现共享锁（Shared Lock）。它用于获取共享访问权限，并允许多个线程同时持有共享访问权限。而boost::shared_mutex用于实现共享-排他锁（Shared-Exclusive Lock）。它提供了一种机制，允许多个线程同时获取共享访问权限，但只允许一个线程获取排他访问权限。

#include <boost/thread>

boost::shared_mutex mutex;  // 创建一个共享-排他锁

void readFunction()
{
    boost::shared_lock<boost::shared_mutex> lock(mutex);  // 获取共享访问权限

    // 在这个代码块中可以安全地读取共享资源

}  // lock对象超出作用域，自动释放共享访问权限

void writeFunction()
{
    boost::unique_lock<boost::shared_mutex> lock(mutex);  // 获取排他访问权限

    // 在这个代码块中可以安全地写入共享资源

}  // lock对象超出作用域，自动释放排他访问权限

#include <boost/thread.hpp> 
#include <iostream> 
#include <vector> 
#include <cstdlib> 
#include <ctime> 

boost::shared_mutex mutex;
std::vector<int> random_numbers;
int sum = 0;

void wait(int seconds) {
    boost::this_thread::sleep(boost::posix_time::seconds(seconds));
}

void fill() {
    std::srand(static_cast<unsigned int>(std::time(0)));
    for (int i = 0; i < 3; ++i) {
        boost::unique_lock<boost::shared_mutex> lock(mutex);
        random_numbers.push_back(std::rand());
        lock.unlock();
        wait(1);
    }
}

void print() {
    for (int i = 0; i < 3; ++i) {
        wait(1);
        boost::shared_lock<boost::shared_mutex> lock(mutex);
        std::cout << random_numbers.back() << std::endl;
    }
}

void count() {
    for (int i = 0; i < 3; ++i) {
        wait(1);
        boost::shared_lock<boost::shared_mutex> lock(mutex);
        sum += random_numbers.back();
    }
}

int main() {
    boost::thread t1(fill);
    boost::thread t2(print);
    boost::thread t3(count);
    t1.join();
    t2.join();
    t3.join();
    std::cout << "Sum: " << sum << std::endl;

    return 1;
}

oost::shared_lock 类型的非独占锁可以在线程只对某个资源读访问的情况下使用。一个线程修改的资源需要写访问，因此需要一个独占锁。这样做也很明显：只需要读访问的线程不需要知道同一时间其他线程是否访问。因此非独占锁可以共享一个互斥体。

在给定的例子， print() 和 count() 都可以只读访问 random_numbers 。虽然 print() 函数把 random_numbers 里的最后一个数写到标准输出，count() 函数把它统计到 sum 变量。由于没有函数修改 random_numbers，所有的都可以在同一时间用 boost::shared_lock 类型的非独占锁访问它。

在 fill() 函数里，需要用一个 boost::unique_lock 类型的非独占锁，因为它插入了一个新的随机数到 random_numbers。在 unlock() 显式地调用 unlock() 来释放互斥量之后， fill() 等待了一秒。相比于之前的那个样子，在 for 循环的尾部调用 wait() 以保证容器里至少存在一个随机数，可以被print() 或者 count() 访问。对应地，这两个函数在 for 循环的开始调用了 wait() 。

考虑到在不同的地方每个单独地调用 wait() ，一个潜在的问题变得很明显:函数调用的顺序直接受CPU执行每个独立进程的顺序决定。利用所谓的条件变量，可以同步哪些独立的线程，使数组的每个元素都被不同的线程立即添加到 random_numbers 。

#include <boost/thread.hpp> 
#include <iostream> 
#include <vector> 
#include <cstdlib> 
#include <ctime> 

boost::mutex mutex;
boost::condition_variable_any cond;
std::vector<int> random_numbers;

void fill() {
    std::srand(static_cast<unsigned int>(std::time(0)));
    for (int i = 0; i < 3; ++i) {
        boost::unique_lock<boost::mutex> lock(mutex);
        random_numbers.push_back(std::rand());
        cond.notify_all();
        cond.wait(mutex);
    }
}

void print() {
    std::size_t next_size = 1;
    for (int i = 0; i < 3; ++i) {
        boost::unique_lock<boost::mutex> lock(mutex);
        while (random_numbers.size() != next_size)
            cond.wait(mutex);
        std::cout << random_numbers.back() << std::endl;
        ++next_size;
        cond.notify_all();
    }
}

int main() {
    boost::thread t1(fill);
    boost::thread t2(print);
    t1.join();
    t2.join();

    return 1;
}

为确保正确地处理随机数，需要一个允许检查多个线程之间特定条件的条件变量来同步不每个独立的线程。

正如上面所说， fill() 函数用在每个迭代产生一个随机数，然后放在 random_numbers 容器中。为了防止其他线程同时访问这个容器，就要相应得使用一个排它锁。不是等待一秒，实际上这个例子却用了一个条件变量。调用 notify_all() 会唤醒每个哪些正在分别通过调用wait() 等待此通知的线程。

通过查看 print() 函数里的 for 循环，可以看到相同的条件变量被 wait() 函数调用了。如果这个线程被 notify_all() 唤醒，它就会试图这个互斥量，但只有在 fill() 函数完全释放之后才能成功。

这里的窍门就是调用 wait() 会释放相应的被参数传入的互斥量。在调用 notify_all()后， fill() 函数会通过 wait() 相应地释放线程。然后它会阻止和等待其他的线程调用 notify_all() ，一旦随机数已写入标准输出流，这就会在 print() 里发生。

注意到在 print() 函数里调用 wait() 事实上发生在一个单独 while 循环里。这样做的目的是为了处理在 print() 函数里第一次调用 wait() 函数之前随机数已经放到容器里。通过比较 random_numbers 里元素的数目与预期值，发现这成功地处理了把随机数写入到标准输出流。

posted @ 2023-06-20 17:53 TechNomad 阅读(583) 评论(0) 收藏举报

刷新页面返回顶部

TechNomad

编程是一场持久战，只有坚持不懈才能取得胜利。

boost库之多线程(四)

公告