CUDA cudaMemcpy函数总结

在使用cuda的时候一定会用到cudaMemcpy这个函数，因为我们就是用它实现数据在CPU与GPU之间的移动，想在GPU端计算就必须要将数据从CPU拷贝到GPU，想要获得GPU的计算结果就必须将结果拷贝回CPU。

但是在使用这个函数的时候对它的第一个参数存在一些疑惑，经过查找资料后做个简单的总结。

首先cudaMemcpy的第一个参数是void**类型，可以看出是一个指向指针的指针，换一种比较好理解的方式可以说是指针的地址，正常我们定义指针：

1 float *a;//定义一个指针
2 a = (float*)malloc(sizeof(float)*size);//分配一定的空间

但是在cuda中我们要用到指针的地址，如果将指针本身当做是一个变量的话，一般函数存在值传递和指针传递，前者无法改变实参中的值，后者可以通过地址对实参的值进行修改。这里传递指针的地址就相当于指针传递，这样我们就可以改变指针中所指向的地址，因为我们是在主机端创建的指针，而需要它指向GPU中的一块区域的地址，所以需要改变它所指向的地址。

1 float *a;
2 //我们经常会看到这种调用方式，对指针的地址进行一个强制转换
3 cudaMalloc((float**)&a,sizeof(float)*size);

这里使用强制转换的原因，因为有一些c编译器不支持隐式转换（c++基本都是支持的），所以在这里加了使用了强制转换。

posted on 2023-08-11 09:41 一杯清酒邀明月阅读(429) 评论(0) 编辑收藏举报