GPU软件抽象与硬件映射的理解(Grid、Block、Warp、Thread与SM、SP)

https://blog.csdn.net/TANGWENTAI/article/details/126818834

 

重新理顺CUDA编程的软硬件关系

https://blog.csdn.net/yychentracy/article/details/90201729

https://blog.csdn.net/u012968002/article/details/70209694

 

cuda中__global__和__device__的区别

__global__是kernel函数,可从cpu调用,调用时用<<< >>>语法配置并行化参数。__device__是只能从一个gpu函数调用,不能从cpu调用。

 

posted @   小丑_jk  阅读(142)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
点击右上角即可分享
微信分享提示