CUDA编程-(2)其实写个矩阵相乘并不是那么难
摘要:
程序代码及图解析: 函数原型:__host__cudaError_t cudaMemcpy (void *dst, const void *src, size_t count, cudaMemcpyKind kind) 作用:在设备端和主机端拷贝数据。 参数:dst 目的地址 src 源地址 cou 阅读全文
posted @ 2016-03-21 17:18 Mereyct 阅读(9598) 评论(2) 推荐(0) 编辑