C++ 并行编程之memory_order

一.如果只是简单地解决在多线程中对共享资源的读写并发问题,只需要用C++以下内容: 线程类 thread, 原子数据类模板 atomic<T> t, 互斥 mutex, 锁 lock, 条件变量 condition_variables.

 
二.在此基础上,如果想在并行编程中获得更好的性能,尤其当使用的是一些弱内存顺序的平台(比如PowerPC)的话,设定原子操作间的内存顺序则很有必要.
 
 
C++11 加入了支持并行编程的原子操作模块,而所有的原子操作都有一个参数 memory_order.
1.内存模型 简介
内存模型是一个硬件上的概念,表示机器指令是以什么样的顺序被处理器执行的 (现代的处理器不是逐条处理机器指令的) .
复制代码
#include <thread>
#include <atomic>
 
atomic<int> a;
atomic<int> b;
void threadHandle()
{
     int t = 1;
     a = t;
     b = 2; // b 的赋值不依赖 a
}
复制代码

在上面的线程处理函数中的三行代码,在寄存器中实际执行顺序可能与代码写的顺序不一致.在不同的机器平台下,处理器有可能对指令周期的执行顺序优化(一个时钟周期发射多条指令),就是说它可能让 b 的赋值语句比 a 的赋值语句先执行.

此时,如果有一个线程在循环地打印 a 和 b 的值,那么结果并不总是 a == 1 和 b == 2.

 

2.如何保证指令执行顺序

保证执行顺序会牺牲一些执行效率,因为这意味着放弃了编译器、处理器等的优化处理。

强顺序的内存模型指: 代码顺序和寄存器实际执行的顺序一致

弱顺序的内存模型指: 寄存器实际执行的顺序与代码顺序不一致,被处理器调整过

 

 

3.C++ 并行编程: 设定 指令执行顺序

复制代码
typedef enum memory_order {
    memory_order_relaxed,    // 不对执行顺序做保证
    memory_order_acquire,    // 本线程中,所有后续的读操作必须在本条原子操作完成后执行
    memory_order_release,    // 本线程中,所有之前的写操作完成后才能执行本条原子操作
    memory_order_acq_rel,    // 同时包含 memory_order_acquire 和 memory_order_release
    memory_order_consume,    // 本线程中,所有后续的有关本原子类型的操作,必须在本条原子操作完成之后执行
    memory_order_seq_cst    // 全部存取都按顺序执行
    } memory_order;
复制代码

 

测试: 下面的代码可能会打印出 a == 0; b == 2 这样的结果

复制代码
 1  #include <iostream>
 2  #include <thread>
 3  #include <atomic>
 4  
 5  atomic<int> a{ 0 };
 6  atomic<int> b{ 0 };
 7  void SetValue()
 8  {// atomic类模板中的函数都是原子操作.  int temp = a.load();相当于 int temp = a的原子操作
 9      int t = 1;
10      a.store(t, memory_order_relaxed); // 相当于 a = t的原子操作
11      b.store(2, memory_order_relaxed); // 相当于 b = 2的原子操作
12  }
13  void Observer()
14  {
15      cout << a << b << endl;
16  }
17  
18  int main()
19  {
20      thread T1(SetValue,0);
21      thread T2(Observer, 0);
22  
23      T1.join(); // 主线程(调用方)等待子线程 T1 执行完成,才能继续执行,阻塞
24      T2.join(); // 同上,执行这一行前: T1已经结束,T2很可能也结束了
25  
26      return 0;
27  }

参考:C++ 多线程与内存模型资料汇
   memory order相关问题
复制代码

 

posted @   子非也  阅读(10512)  评论(0编辑  收藏  举报
编辑推荐:
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统?
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 现代计算机视觉入门之:什么是图片特征编码
· .NET 9 new features-C#13新的锁类型和语义
阅读排行:
· 《HelloGitHub》第 106 期
· Spring AI + Ollama 实现 deepseek-r1 的API服务和调用
· 数据库服务器 SQL Server 版本升级公告
· 深入理解Mybatis分库分表执行原理
· 使用 Dify + LLM 构建精确任务处理应用
点击右上角即可分享
微信分享提示