C++ 并行编程之memory_order

一.如果只是简单地解决在多线程中对共享资源的读写并发问题,只需要用C++以下内容: 线程类 thread, 原子数据类模板 atomic<T> t, 互斥 mutex, 锁 lock, 条件变量 condition_variables.

二.在此基础上,如果想在并行编程中获得更好的性能,尤其当使用的是一些弱内存顺序的平台(比如PowerPC)的话,设定原子操作间的内存顺序则很有必要.

C++11 加入了支持并行编程的原子操作模块,而所有的原子操作都有一个参数 memory_order.

1.内存模型简介

内存模型是一个硬件上的概念,表示机器指令是以什么样的顺序被处理器执行的 (现代的处理器不是逐条处理机器指令的) .

#include <thread>
#include <atomic>
 
atomic<int> a;
atomic<int> b;
void threadHandle()
{
     int t = 1;
     a = t;
     b = 2; // b 的赋值不依赖 a
}

在上面的线程处理函数中的三行代码,在寄存器中实际执行顺序可能与代码写的顺序不一致.在不同的机器平台下,处理器有可能对指令周期的执行顺序优化(一个时钟周期发射多条指令),就是说它可能让 b 的赋值语句比 a 的赋值语句先执行.

此时,如果有一个线程在循环地打印 a 和 b 的值,那么结果并不总是 a == 1 和 b == 2.

2.如何保证指令执行顺序

保证执行顺序会牺牲一些执行效率，因为这意味着放弃了编译器、处理器等的优化处理。

强顺序的内存模型指: 代码顺序和寄存器实际执行的顺序一致

弱顺序的内存模型指: 寄存器实际执行的顺序与代码顺序不一致,被处理器调整过

3.C++ 并行编程: 设定指令执行顺序

typedef enum memory_order {
    memory_order_relaxed,    // 不对执行顺序做保证
    memory_order_acquire,    // 本线程中,所有后续的读操作必须在本条原子操作完成后执行
    memory_order_release,    // 本线程中,所有之前的写操作完成后才能执行本条原子操作
    memory_order_acq_rel,    // 同时包含 memory_order_acquire 和 memory_order_release
    memory_order_consume,    // 本线程中,所有后续的有关本原子类型的操作,必须在本条原子操作完成之后执行
    memory_order_seq_cst    // 全部存取都按顺序执行
    } memory_order;

测试: 下面的代码可能会打印出 a == 0; b == 2 这样的结果

 1  #include <iostream>
 2  #include <thread>
 3  #include <atomic>
 4  
 5  atomic<int> a{ 0 };
 6  atomic<int> b{ 0 };
 7  void SetValue()
 8  {// atomic类模板中的函数都是原子操作.  int temp = a.load();相当于 int temp = a的原子操作
 9      int t = 1;
10      a.store(t, memory_order_relaxed); // 相当于 a = t的原子操作
11      b.store(2, memory_order_relaxed); // 相当于 b = 2的原子操作
12  }
13  void Observer()
14  {
15      cout << a << b << endl;
16  }
17  
18  int main()
19  {
20      thread T1(SetValue,0);
21      thread T2(Observer, 0);
22  
23      T1.join(); // 主线程(调用方)等待子线程 T1 执行完成,才能继续执行,阻塞
24      T2.join(); // 同上,执行这一行前: T1已经结束,T2很可能也结束了
25  
26      return 0;
27  }

参考：C++ 多线程与内存模型资料汇

　　　memory order相关问题

posted @ 2018-01-04 18:21 子非也阅读(10549) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列01：轻松3步本地部署deepseek，普通电脑可用
· 按钮权限的设计及实现
· 25岁的心里话

公告

昵称：子非也
园龄： 7年3个月
粉丝： 0
关注： 46

+加关注

2025年3月

日

一

二

三

四

五

六

子非也

C++ 并行编程之memory_order

一.如果只是简单地解决在多线程中对共享资源的读写并发问题,只需要用C++以下内容: 线程类 thread, 原子数据类模板 atomic<T> t, 互斥 mutex, 锁 lock, 条件变量 condition_variables.

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类 (4)

随笔档案 (6)

Net

阅读排行榜

推荐排行榜