title: 【CUDA 基础】5.3 减少全局内存访问
categories:
- CUDA
- Freshman
tags:
- 共享内存
- 归约
toc: true
date: 2018-06-04 19:47:29


Abstract: 本文介绍使用共享内存进行归约,并比较全局内存归约与共享内存归约之间的性能差距
Keywords: 共享内存,归约

开篇废话

逻辑是非常重要的,一旦你学会了逻辑,很多假的东西你可以轻松的识别出来,这会使你更加强大而不会被任何人或者组织洗脑。
废话少说,开始今天的博客。
使用共享内存的主要原因就是减少对全局内存的访问,来减少不必要的延迟,第三章我们学过了归约,可以参考:

这两篇博客包含我们前面使用全局内存进行归约的各种技术,我们几天也要用其中一部分代码作为比较,来体现我们共享内存的优势。
我们要集中解决下面两个问题:

  1. 如何重新安排数据访问模式以避免线程束分化
  2. 如何展开循环以保证有足够的操作使指令和内存带宽饱和

本文我们通过对比研究前面的部分代码,来分析为何要使用共享内存,以及如何使用共享内存。

使用共享内存的并行归约

完整内容https://face2ai.com/CUDA-F-5-3-减少全局内存访问/

 posted on 2018-06-26 18:07  TonyShengTan  阅读(415)  评论(0编辑  收藏  举报