如何理解CUDA中的cudaMalloc()的参数
首先看下此运行时函数的原型:
cudaError_t cudaMalloc (void **devPtr, size_t size );
主要的第一个参数。为什么是两个星星呢?用个例子来说明下。
float *device_data=NULL; size_t size = 1024*sizeof(float); cudaMalloc((void**)&device_data, size);
例子中:
我在显存中申请了一个包含1024个元素的float数组。而device_data这个指针是存储在主存上的。之所以取device_data的地址,是为了将cudaMalloc在显存上获得的数组首地址赋值给device_data。在函数中为形参赋值是不会在实参中繁盛变化的,但是指针传递的是地址,我们操作了某个地址的数据,实际上是真的改变了指定地址的数据。像这个申请显存的函数,第一个参数传递的是device_data这个指针的地址,然后改变这个地址的内容就会带给实参真正的改变。