随笔分类 - CUDA program
摘要:
# CUDA优化  ## 避免Warp分化 ```C++ if (con) { //do somethin
阅读全文

摘要:
# CUDA笔记 ## CUDA基础 ### grid block thread划分  32个线程为一个W
阅读全文

摘要:
TVM源码编译 安装依赖 sudo apt-get install -y libtinfo-dev zlib1g-dev build-essential libedit-dev libxml2-dev 安装llvm link: https://www.cnblogs.com/nanmi/p/1604
阅读全文

摘要:CUDA程序调试cuda_gdb 本文部分引用和参考自博客:https://blog.csdn.net/qqdkg/article/details/118713504 在 linux 下 CUDA 程序的 Debug 方法 调试过程 # -g -G 代表为 CPU 和 GPU 代码部分进行调试编译
阅读全文
摘要:查看Linux显卡的详细信息 我在开展CUDA编程的学习时需要了解GPU的算力和grid、block、thread的最大数值及维度等信息。 首先安装显卡驱动,如果显卡驱动安装没问题,找到 /usr/local/cuda-10.2/samples/1_Utilities/deviceQuery 如果此
阅读全文
摘要:CUDA C编程,GPU编程,GPU优化计算 CUDA编程套路格式 根据《GPU编程与优化》的学习有: 1.获取配置GPU设备 1 cudaSetDevice(0); //获取GPU设备,如果只有一个默认为0,这个时候可以缺省,其他情况这不行。 2.分配GPU显存大小 1 cudaMalloc((v
阅读全文
有N卡但是nvidia-smi命令不显示信息出现NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver
摘要:问题描述:使用nvidia-smi命令出现NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installe
阅读全文