摘要:GitHub - parallel101/course: 高性能并行编程与优化 - 课件
阅读全文
随笔分类 - cuda编程
摘要:https://zhuanlan.zhihu.com/p/654572960?utm_source=wechat_session&utm_medium=social&s_r=0
阅读全文
摘要:找到对应的设备信息查看自己的设备性能 (008) Multiprocessors, (064) CUDA Cores/MP: 512 CUDA Cores解释为 有8个SM每个SM中有两个MP每个MP有32个core所有64个(064) CUDA Cores/MP 一些GPU的架构 Warp siz
阅读全文
摘要:1.安装cuda 2.安装插件Nsight Visual Studio Code Edition 和c++ 3.给VSCode添加头文件的搜索路径 (55条消息) vscode中配置或添加头文件路径_vscode 配置头文件路径_Markus.Zhao的博客-CSDN博客 4.没有提示 blockD
阅读全文
摘要:#include <stdio.h> #include <cuda_runtime.h> /* CUDA核函数 __global__ 核函数的前缀定义 - 使用__global__修饰的函数,必须是void无返回值 - __global__核函数修饰,必须是nvcc编译才有效,否则无效 - __gl
阅读全文