MoonZZZ

2023年8月12日

摘要：统一内存(unified memory)是一种逻辑上的概念，它既不是显存、也不是主机内存，而是CPU和GPU都可以访问并能保证一致性的虚拟存储器。使用统一内存对硬件有较高的要求： - 对于所有功能，GPU架构都必须不低于Kepler架构，主机应用程序必须为64位。 - 对于一些较新的功能，至少需要P 阅读全文

posted @ 2023-08-12 10:58 MoonZZZ 阅读(931) 评论(0) 推荐(0)

2023年8月11日

《CUDA编程：基础与实践》读书笔记(4)：CUDA流

摘要： ## 1. CUDA流一个CUDA流指的是由主机发出的在一个设备中执行的CUDA操作序列。除主机端发出的流之外，还有设备端发出的流，但本文不考虑后者。一个CUDA流中的各个操作按照主机发布的次序执行；但来自两个不同CUDA流的操作不一定按照某个次序执行，有可能是并发或者交错地执行。任何CUDA操阅读全文

posted @ 2023-08-11 09:13 MoonZZZ 阅读(871) 评论(0) 推荐(1)

2023年8月10日

《CUDA编程：基础与实践》读书笔记(3)：同步、协作组、原子函数

摘要： ## 1. 单指令多线程模式从硬件上看，一个GPU被分为若干个SM。线程块在执行时将被分配到还没完全占满的SM中，一个线程块不会被分配到不同的SM中，一个SM可以有一个或多个线程块。不同线程块之间可以并发或顺序地执行。当某些线程块完成计算任务后，对应的SM会部分或完全地空闲，然后会有新的线程块被分阅读全文

posted @ 2023-08-10 09:12 MoonZZZ 阅读(1077) 评论(0) 推荐(0)

2023年8月9日

《CUDA编程：基础与实践》读书笔记(2)：CUDA内存

摘要： ## 1. 全局内存核函数中的所有线程都能够访问全局内存(global memory)。全局内存的容量是所有设备内存中最大的，但由于它没有放在GPU芯片内部，因此具有相对较高的延迟和较低的访问速度，`cudaMalloc`分配的就是全局内存。此外，当处理逻辑上的二维或者三维问题时，还可以使用`cu 阅读全文

posted @ 2023-08-09 09:01 MoonZZZ 阅读(717) 评论(0) 推荐(0)

2023年8月8日

《CUDA编程：基础与实践》读书笔记(1)：CUDA编程基础

摘要： ## 1. GPU简介 GPU与CPU的主要区别在于： - CPU拥有少数几个快速的计算核心，而GPU拥有成百上千个不那么快速的计算核心。 - CPU中有更多的晶体管用于数据缓存和流程控制，而GPU中有更多的晶体管用于算数逻辑单元。所以，GPU依靠众多的计算核心来获得相对较高的并行计算性能。一块阅读全文

posted @ 2023-08-08 22:20 MoonZZZ 阅读(1345) 评论(0) 推荐(3)

公告