CUDA自学的理解

1. CUDA 的globle 是主机上的函数,实际运行在GPU上。运行在GPU上的CUDA并行计算函数成为kernel(内核函数)就是gloable 函数

2. 内核函数的调用方法  add<<<1,N>>>(参数1,参数2)。

3. CUD的构架分为主机端,设备端,主机端是CPU, 设备端是GPU。所以程序运行分为两部分,一部分是CPU上跑的,一部分是GPU上跑的。CPU首先

把数据传给GPU,然后GPU处理完之后把数据返回给CPU。

4. GPU的结构最小单位是 kernel, 难道一个内核函数跑在一个kernel 上?多个kernel 组成一个block

posted @ 2022-09-30 17:05  429512065  阅读(62)  评论(0编辑  收藏  举报