随笔分类 -  [并行计算]

摘要:一、重新分析矩阵相乘 上述代码实现了矩阵相乘,但是只使用了一个Block来完成,那么能够计算的矩阵大小就被Block的最大容量所限制了。我们要完成大型矩阵相乘的计算,则需要将矩阵分块来处理,也就是使用多个Block来并行完成: 在调用时,我们需要计算需要多少个Blocks,由于例子中使用的是方阵,所 阅读全文
posted @ 2019-09-02 17:23 风间悠香 阅读(582) 评论(0) 推荐(0) 编辑
摘要:一、CPU和GPU交互 1.各自有自己的物理内存空间,CPU的是内存,GPU的是显存 2.通过PCI-E总线互连(8GB/S~16GB/S) 3.交互开销较大 GPU各存储访存速度: Register寄存器,最快 Shared Memory,共享存储,很快 Local Memory,本地存储,在显存 阅读全文
posted @ 2019-08-29 17:41 风间悠香 阅读(1058) 评论(0) 推荐(0) 编辑
摘要:一、常用术语 Task:任务。可以完整得到结果的一个程序,一个程序段或若干个程序段。例如搬砖。 Parallel Task:并行任务。可以并行计算的任务。多个人搬砖。 Serial Execution:串行执行。一个人搬砖。 Parallel Execution:并行执行。多个人一起搬砖。 Shar 阅读全文
posted @ 2019-08-29 10:51 风间悠香 阅读(2395) 评论(0) 推荐(2) 编辑

点击右上角即可分享
微信分享提示