摘要: 开始学CUDA 先写一个简单的#include__global__ void add( int a, int b, int *c ) { *c = a + b;}int main(){ int c; int * dev_c; cudaMalloc((void**)&dev_c,sizeof(int));//在显存开辟空间 add>>(10,11,dev_c);//为函数分配一个block,每个block分配一个线程 cudaMemcpy(&c,dev_c,sizeof(int),cudaMemcpyDeviceToHost);//讲显存数据拷贝到内存... 阅读全文
posted @ 2014-03-06 21:37 枫月寒 阅读(307) 评论(0) 推荐(0) 编辑