2013年8月5日

cuda(2) 矩阵乘法优化过程

摘要: Created on 2013-8-5URL :http://blog.sina.com.cn/s/blog_a502f1a30101mjch.html@author: zhxfl转载请说明出处 1 #include 2 #include 3 #include 4 __global__ void matrixMulCUDA(int *A,int *B,int * C, 5 dim3 dimsA,dim3 dimsB, dim3 dimsC) 6 { 7 int i = blockIdx.x; 8 int j = threadIdx.x; ... 阅读全文

posted @ 2013-08-05 15:17 zhxfl 阅读(1698) 评论(0) 推荐(0) 编辑

cuda(1) 最大并发量

摘要: Created on 2013-8-5URL : http://blog.sina.com.cn/s/blog_a502f1a30101mi6t.html@author: zhxfl转载请说明出处 1 cudaDeviceProp prop; 2 3 int count; 4 ( cudaGetDeviceCount( &count ) ); 5 for (int i=0; i>()2)正常:function >()3)崩溃:function >()4)正常:function >()5)崩溃:function >()其中第一个的崩溃让人无法理解,其他都符合 阅读全文

posted @ 2013-08-05 14:23 zhxfl 阅读(1744) 评论(0) 推荐(0) 编辑

导航