摘要:
前面我们实现了向量的加法,今天我们实现复杂一些的运算,矩阵的加法,即将矩阵对应位置上的元素进行相加,相当于向量加法的升级版本。不过需要注意的是,malloc时需要分配二维矩阵,这样才能使用A[i][j]; CPU实现 CPP实现起来的注意点在于二维数组的开辟,通过给二维数组的每一个指针赋值实现二维数 阅读全文
摘要:
当你看到这篇博客的时候,我相信你已对CUDA有所了解,CUDA是针对于GPU的一种C/C++扩展库,使用cuda可以很方便地进行并行编程。 那么今天第一讲便是如何获取GPU的各种参数,cudaDeviceProp是cuda库中已经封装好的结构体,通过调用cudaGetDeviceProperties 阅读全文
摘要:
CUDA C是一种在GPU上支持多线程并行化的语言,有了CUDA,很多需要多线程运行的程序变得简单起来,今天我们将从CUDA的的向量加法说起。 问题定义 向量加法是十分常见的操作,对于一个长度为n的向量,其运算规则如下: \({c[i] = a[i] + b[i] for i < n}\) 即将对应 阅读全文