CUDA自学的理解

1. CUDA 的globle 是主机上的函数,实际运行在GPU上。运行在GPU上的CUDA并行计算函数成为kernel(内核函数)就是gloable 函数

2. 内核函数的调用方法  add<<<1,N>>>(参数1,参数2)。

3. CUD的构架分为主机端,设备端,主机端是CPU, 设备端是GPU。所以程序运行分为两部分,一部分是CPU上跑的,一部分是GPU上跑的。CPU首先

把数据传给GPU,然后GPU处理完之后把数据返回给CPU。

4. GPU的结构最小单位是 kernel, 难道一个内核函数跑在一个kernel 上?多个kernel 组成一个block

posted @   429512065  阅读(72)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App
历史上的今天:
2021-09-30 关于C语言二级指针的一个问题
2020-09-30 CMake Error: Could not find CMAKE_ROOT !!!
点击右上角即可分享
微信分享提示