上一页 1 ··· 25 26 27 28 29 30 31 32 33 ··· 40 下一页
摘要: 在并发,多线程环境下,同步是一个很重要的环节。同步即是指进程/线程之间的执行顺序约定。 本文将介绍如何通过共享内存机制实现块内多线程之间的同步。 阅读全文
posted @ 2017-01-19 15:25 穆晨 阅读(7159) 评论(0) 推荐(0) 编辑
摘要: 编写 CUDA 程序真心不是个简单的事儿,调试也不方便,很费时。那么有没有一些现成的 CUDA 库来调用呢? 答案是有的,如 CUBLAS 就是 CUDA 专门用来解决线性代数运算的库。 本文将大致介绍如何使用 CUBLAS 库,同时演示一个使用 CUBLAS 库进行矩阵乘法的例子。 阅读全文
posted @ 2017-01-19 15:20 穆晨 阅读(3055) 评论(0) 推荐(1) 编辑
摘要: 本文将介绍 CUDA 编程的基本模式,所有 CUDA 程序都基于此模式编写,即使是调用库,库的底层也是这个模式实现的。 阅读全文
posted @ 2017-01-19 15:16 穆晨 阅读(2929) 评论(0) 推荐(0) 编辑
摘要: 并行就是让计算中相同或不同阶段的各个处理同时进行。 目前有很多种实现并行的手段,如多核处理器,分布式系统等,而本专题的文章将主要介绍使用 GPU 实现并行的方法。 阅读全文
posted @ 2017-01-19 14:59 穆晨 阅读(2923) 评论(0) 推荐(0) 编辑
上一页 1 ··· 25 26 27 28 29 30 31 32 33 ··· 40 下一页