摘要:
__global__ void VecAdd(float* A,float* B,float* C){}int main(){VecAdd<<<1,N>>>(A,B,C);}其中,1,N是函数执行参数,代表kernel的Grid中只有一个block,而每个block中则有N个thread,而A,B,C是函数的参数。其中threadID和blockID都是内建的变量,用于和其他的线程相区分。Kernel是以block为单位执行的。下面演示对两个N*N的矩阵A和B进行求和。并将结果保存在C中。__global__ void MatAdd(float A[N][N 阅读全文