爨爨爨好

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年11月23日

摘要: 使用多台 GPU 进行计算▶ 源代码。使用不同的流来控制不同 GPU 上的运算任务。 ▶ 输出结果 ▶ 涨姿势 ● 在使用不同的设备执行相关函数(包括 cudaFree 等主机函数)时要注意,使用函数 cudaSetDevice() 来切换设备。 阅读全文
posted @ 2017-11-23 12:30 爨爨爨好 阅读(338) 评论(0) 推荐(0) 编辑

摘要: 利用 CUDA 的 Overlap 特性同时进行运算和数据拷贝来实现加速。 ▶ 源代码。使用 4 个流一共执行 10 次 “数据上传 - 内核计算 - 数据下载” 过程,记录使用时间。 ▶ 输出结果 ▶ 涨姿势 ● 没有 阅读全文
posted @ 2017-11-23 11:12 爨爨爨好 阅读(630) 评论(0) 推荐(0) 编辑

摘要: MPI 的简单使用▶ 源代码。主机根结点生成随机数组,发布副本到各结点(例子用孩子使用了一个结点),分别使用 GPU 求平方根并求和,然后根结点使用 MPI 回收各节点的计算结果,规约求和后除以数组大小(相当于球随机数组中所有元素的平方根的平均值)。 ▶ 输出结果 ▶ 涨姿势 ● 集中在 MPI 的 阅读全文
posted @ 2017-11-23 10:01 爨爨爨好 阅读(505) 评论(0) 推荐(0) 编辑