随笔分类 -  Cuda

摘要:Thrust是cuda自带的c++库,cuda安装好之后,这个库也默认安装好了。 这个库基本是采用类似STL的接口方式,因此对于开发者非常友好,开发者不再需要关注内存与显存相关的问题了。 下面是一个简单的排序代码 main.cu: #include <thrust/host_vector.h> #i 阅读全文
posted @ 2020-03-03 23:55 Dsp Tian 阅读(4190) 评论(0) 推荐(2) 编辑
摘要:首先这里有两段代码: main.cpp: #include <stdio.h> #include <iostream> extern "C" { int func(); } int main() { std::cout<<"Hello C++"<<std::endl; func(); return 阅读全文
posted @ 2020-02-17 13:26 Dsp Tian 阅读(883) 评论(0) 推荐(0) 编辑
摘要:这里矩阵C=A*B,原始文档给的公式是C=alpha*A*B+beta*C,所以这里alpha=1,beta=0。 主要使用cublasSgemm这个函数,这个函数的第二个参数有三种类型,这里CUBLAS_OP_N求出来矩阵结果是按行排列,所以不需要转置了。 如果用CUBLAS_OP_T参数求得的结 阅读全文
posted @ 2018-08-12 16:47 Dsp Tian 阅读(4478) 评论(0) 推荐(0) 编辑
摘要:参考stackoverflow一篇帖子的处理方法:https://stackoverflow.com/questions/26913683/different-way-to-index-threads-in-cuda-c 代码中cuda_gridsize函数参考yolo。 代码如下: 阅读全文
posted @ 2018-08-11 16:24 Dsp Tian 阅读(1972) 评论(0) 推荐(0) 编辑
摘要:threadIdx是一个uint3类型,表示一个线程的索引。 blockIdx是一个uint3类型,表示一个线程块的索引,一个线程块中通常有多个线程。 blockDim是一个dim3类型,表示线程块的大小。 gridDim是一个dim3类型,表示网格的大小,一个网格中通常有多个线程块。 下面这张图比 阅读全文
posted @ 2018-08-11 10:30 Dsp Tian 阅读(22447) 评论(0) 推荐(4) 编辑
摘要:gcc8.1和cuda9.0版本不兼容,比较坑。 下面是各版本cuda支持的gcc: 从CUDA 4.1版本开始,现在支持gcc 4.5。gcc 4.6和4.7不受支持。 从CUDA 5.0版本开始,现在支持gcc 4.6。gcc 4.7不受支持。 从CUDA 6.0版本开始,现在支持gcc 4.7 阅读全文
posted @ 2018-08-08 11:00 Dsp Tian 阅读(6573) 评论(0) 推荐(2) 编辑
摘要:https://devtalk.nvidia.com/default/topic/1027209/cuda-setup-and-installation/cuda-9-0-does-not-work-with-the-latest-vs-2017-update/ 阅读全文
posted @ 2018-07-04 22:29 Dsp Tian 阅读(1214) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示