一杯清酒邀明月
天下本无事,庸人扰之而烦耳。
posts - 3121,comments - 209,views - 578万

  什么是OpenMP

  Open Multi-Processing的缩写,是一个应用程序接口(API),可用于显式指导多线程、共享内存的并行性。

  在项目程序已经完成好的情况下不需要大幅度的修改源代码,只需要加上专用的pragma来指明自己的意图,由此编译器可以自动将程序进行并行化,并在必要之处加入同步互斥以及通信。当选择忽略这些pragma,或者编译器不支持OpenMp时,程序又可退化为通常的程序(一般为串行),代码仍然可以正常运作,只是不能利用多线程来加速程序执行。OpenMP提供的这种对于并行描述的高层抽象降低了并行编程的难度和复杂度,这样程序员可以把更多的精力投入到并行算法本身,而非其具体实现细节。对基于数据分集的多线程程序设计,OpenMP是一个很好的选择。

  OpenMP支持的语言包括C/C++、Fortran;而支持OpenMP的编译器VS、gcc、clang等都行。可移植性也很好:Unix/Linux和Windows

  OpenMP编程模型

  内存共享模型:OpenMP是专为多处理器/核,共享内存机器所设计的。底层架构可以是UMA和NUMA。即(Uniform Memory Access和Non-Uniform Memory Access)

  基于线程的并行性

  • OpenMP仅通过线程来完成并行
  • 一个线程的运行是可由操作系统调用的最小处理单
  • 线程们存在于单个进程的资源中,没有了这个进程,线程也不存在了
  • 通常,线程数与机器的处理器/核数相匹配,然而,实际使用取决与应用程序

  明确的并行

  • OpenMP是一种显式(非自动)编程模型,为程序员提供对并行化的完全控制
  • 一方面,并行化可像执行串行程序和插入编译指令那样简单
  • 另一方面,像插入子程序来设置多级并行、锁、甚至嵌套锁一样复杂

  Fork-Join模型

  • OpenMP就是采用Fork-Join模型
  • 所有的OpenML程序都以一个单个进程——master thread开始,master threads按顺序执行知道遇到第一个并行区域
  • Fork:主线程创造一个并行线程组
  • Join:当线程组完成并行区域的语句时,它们同步、终止,仅留下主线程

  数据范围

  • 由于OpenMP时是共享内存模型,默认情况下,在共享区域的大部分数据是被共享的
  • 并行区域中的所有线程可以同时访问这个共享的数据
  • 如果不需要默认的共享作用域,OpenMP为程序员提供一种“显示”指定数据作用域的方法

  嵌套并行

  • API提供在其它并行区域放置并行区域
  • 实际实现也可能不支持

  动态线程

  • API为运行环境提供动态的改变用于执行并行区域的线程数
  • 实际实现也可能不支持

简单使用

在VS2017中就可以使用,具体的:新建一个C/C++程序,项目--属性--C/C++--语言--OpenMP支持,把OpenMP打开。然后编写带编译指令的并行程序,注意一定要加上<omp.h>头文件。

写一个并行的Hello World

复制代码
 1 #include <omp.h>
 2 #include <stdio.h>
 3 #include <stdlib.h>
 4 
 5 int main()
 6 {
 7     int nthreads, tid;
 8 
 9     /* Fork a team of threads giving them their own copies of variables */
10     #pragma omp parallel private(nthreads, tid)
11     {
12 
13         /* Obtain thread number */
14         tid = omp_get_thread_num();
15         printf("Hello World from thread = %d\n", tid);
16 
17         /* Only master thread does this */
18         if (tid == 0)
19         {
20             nthreads = omp_get_num_threads();
21             printf("Number of threads = %d\n", nthreads);
22         }
23 
24     }  /* All threads join master thread and disband */
25     return 0;
26 }
复制代码

运行结果如下:

注:我的电脑默认是4个线程,不同的电脑运行结果不同,就算是同一部电脑每次运行的结果也可能不同(4个线程并行执行,没有确定的先后顺序)

也可以直接使用gcc加上-fopenmp编译,For example:

1 g++ test.cpp -o test -fopenmp
2 ./test

(不知道我的gcc不行,只能用g++,枯了)

补:直到原因了,gcc默认编译链接不会链接C++标准库,可以使用g++编译链接(如上),也可以在gcc链接时显示指定链接 -lstdc++

gcc test.cpp -o test -fopenmp -lstdc++

 

posted on   一杯清酒邀明月  阅读(718)  评论(0编辑  收藏  举报
编辑推荐:
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
阅读排行:
· 全网最简单!3分钟用满血DeepSeek R1开发一款AI智能客服,零代码轻松接入微信、公众号、小程
· .NET 10 首个预览版发布,跨平台开发与性能全面提升
· 《HelloGitHub》第 107 期
· 全程使用 AI 从 0 到 1 写了个小工具
· 从文本到图像:SSE 如何助力 AI 内容实时呈现?(Typescript篇)
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示