摘要: __global__ void VecAdd(float* A,float* B,float* C){}int main(){VecAdd<<<1,N>>>(A,B,C);}其中,1,N是函数执行参数,代表kernel的Grid中只有一个block,而每个block中则有N个thread,而A,B,C是函数的参数。其中threadID和blockID都是内建的变量,用于和其他的线程相区分。Kernel是以block为单位执行的。下面演示对两个N*N的矩阵A和B进行求和。并将结果保存在C中。__global__ void MatAdd(float A[N][N 阅读全文
posted @ 2011-11-05 20:30 张兰云 阅读(535) 评论(0) 推荐(0) 编辑