在使用cuda的时候一定会用到cudaMemcpy这个函数,因为我们就是用它实现数据在CPU与GPU之间的移动,想在GPU端计算就必须要将数据从CPU拷贝到GPU,想要获得GPU的计算结果就必须将结果拷贝回CPU。
但是在使用这个函数的时候对它的第一个参数存在一些疑惑,经过查找资料后做个简单的总结。
首先cudaMemcpy的第一个参数是void**类型,可以看出是一个指向指针的指针,换一种比较好理解的方式可以说是指针的地址,正常我们定义指针:
1 float *a;//定义一个指针
2 a = (float*)malloc(sizeof(float)*size);//分配一定的空间
但是在cuda中我们要用到指针的地址,如果将指针本身当做是一个变量的话,一般函数存在值传递和指针传递,前者无法改变实参中的值,后者可以通过地址对实参的值进行修改。这里传递指针的地址就相当于指针传递,这样我们就可以改变指针中所指向的地址,因为我们是在主机端创建的指针,而需要它指向GPU中的一块区域的地址,所以需要改变它所指向的地址。
1 float *a;
2 //我们经常会看到这种调用方式,对指针的地址进行一个强制转换
3 cudaMalloc((float**)&a,sizeof(float)*size);
这里使用强制转换的原因,因为有一些c编译器不支持隐式转换(c++基本都是支持的),所以在这里加了使用了强制转换。