2016年3月21日

CUDA编程-(2)其实写个矩阵相乘并不是那么难

摘要: 程序代码及图解析: 函数原型:__host__cudaError_t cudaMemcpy (void *dst, const void *src, size_t count, cudaMemcpyKind kind) 作用:在设备端和主机端拷贝数据。 参数:dst 目的地址 src 源地址 cou 阅读全文

posted @ 2016-03-21 17:18 Mereyct 阅读(9598) 评论(2) 推荐(0) 编辑

CUDA编程-(1)Tesla服务器Kepler架构和万年的HelloWorld

摘要: 结合CUDA范例精解以及CUDA并行编程。由于正在学习CUDA,CUDA用的比较多,因此翻译一些个人认为重点的章节和句子,作为学习,程序将通过NVIDIA K40服务器得出结果。如果想通过本书进行CUDA编程,又不太懂CUDA和GPU的架构,可以将这个博客作为入门博客(但是希望你能有些基础,因为我介 阅读全文

posted @ 2016-03-21 10:26 Mereyct 阅读(2278) 评论(1) 推荐(0) 编辑

导航