随笔分类 -  CUDA program

摘要:CUDA优化# CUDA优化 ![image](https://img2023.cnblogs.com/blog/1990650/202306/1990650-20230625164824401-216646758.png) ## 避免Warp分化 ```C++ if (con) { //do somethin 阅读全文
posted @ 2023-03-14 17:09 nanmi 阅读(172) 评论(0) 推荐(0) 编辑
摘要:CUDA笔记# CUDA笔记 ## CUDA基础 ### grid block thread划分 ![image](https://img2022.cnblogs.com/blog/1990650/202209/1990650-20220923110432233-630168325.png) 32个线程为一个W 阅读全文
posted @ 2022-09-23 11:45 nanmi 阅读(733) 评论(0) 推荐(0) 编辑
摘要:TVM源码编译TVM源码编译 安装依赖 sudo apt-get install -y libtinfo-dev zlib1g-dev build-essential libedit-dev libxml2-dev 安装llvm link: https://www.cnblogs.com/nanmi/p/1604 阅读全文
posted @ 2022-03-24 13:23 nanmi 阅读(267) 评论(0) 推荐(0) 编辑
摘要:CUDA程序调试cuda_gdb 本文部分引用和参考自博客:https://blog.csdn.net/qqdkg/article/details/118713504 在 linux 下 CUDA 程序的 Debug 方法 调试过程 # -g -G 代表为 CPU 和 GPU 代码部分进行调试编译 阅读全文
posted @ 2021-07-16 12:40 nanmi 阅读(662) 评论(0) 推荐(0) 编辑
摘要:查看Linux显卡的详细信息 我在开展CUDA编程的学习时需要了解GPU的算力和grid、block、thread的最大数值及维度等信息。 首先安装显卡驱动,如果显卡驱动安装没问题,找到 /usr/local/cuda-10.2/samples/1_Utilities/deviceQuery 如果此 阅读全文
posted @ 2020-06-11 09:23 nanmi 阅读(3760) 评论(0) 推荐(0) 编辑
摘要:CUDA C编程,GPU编程,GPU优化计算 CUDA编程套路格式 根据《GPU编程与优化》的学习有: 1.获取配置GPU设备 1 cudaSetDevice(0); //获取GPU设备,如果只有一个默认为0,这个时候可以缺省,其他情况这不行。 2.分配GPU显存大小 1 cudaMalloc((v 阅读全文
posted @ 2020-04-02 09:00 nanmi 阅读(508) 评论(0) 推荐(0) 编辑
摘要:问题描述:使用nvidia-smi命令出现NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installe 阅读全文
posted @ 2020-04-02 08:53 nanmi 阅读(8510) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示