摘要: 利用Block和Thread进行并行加速_global_ void add(int *a, int *b, int *c){ int index = threadIdx.x + blockIdx.x * blockDim.x; c[index] = a[index] + b[index]... 阅读全文
posted @ 2014-11-29 11:49 Albert-Lxy 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 我们知道一个grid包含多个block,而一个block又包含多个thread,下面将是如何进行下thread中的并行。/**** Splot a block into parallel threads****/_global_ void add(int *a, int *b, int *c){ ... 阅读全文
posted @ 2014-11-29 11:31 Albert-Lxy 阅读(160) 评论(0) 推荐(0) 编辑
摘要: 将数据加载到GPU后,如何在grid下的block进行并行计算(一个grid包含多个block)/****How do we run code in parallel on the device****/ /****Use block****/ _global_ void add(int... 阅读全文
posted @ 2014-11-29 11:24 Albert-Lxy 阅读(187) 评论(0) 推荐(0) 编辑
摘要: /****c code****/#includeint main(){ printf("Hello world!\n); return 0;}/****CUDA code****/_global_ void mykernel(void){}int main(){ mykernel>... 阅读全文
posted @ 2014-11-29 10:56 Albert-Lxy 阅读(259) 评论(0) 推荐(0) 编辑