如何理解CUDA中的cudaMalloc()的参数

首先看下此运行时函数的原型:

cudaError_t cudaMalloc (void **devPtr, size_t  size ); 

主要的第一个参数。为什么是两个星星呢?用个例子来说明下。

float *device_data=NULL;
size_t size = 1024*sizeof(float);
cudaMalloc((void**)&device_data, size);

例子中:

我在显存中申请了一个包含1024个元素的float数组。而device_data这个指针是存储在主存上的。之所以取device_data的地址,是为了将cudaMalloc在显存上获得的数组首地址赋值给device_data。在函数中为形参赋值是不会在实参中繁盛变化的,但是指针传递的是地址,我们操作了某个地址的数据,实际上是真的改变了指定地址的数据。像这个申请显存的函数,第一个参数传递的是device_data这个指针的地址,然后改变这个地址的内容就会带给实参真正的改变。

 

posted @ 2014-01-10 20:28  yexuannan  阅读(2332)  评论(0编辑  收藏  举报