会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB

- 所有博客
- 当前博客
我的博客我的园子账号设置会员中心简洁模式 ... 退出登录

注册登录

Magnum Programm Life

博客园
首页
新随笔
联系
管理
订阅

CUDA 进阶学习

CUDA基本概念
CUDA网格限制
1.2CPU和GPU的设计区别
2.1CUDA-Thread
2.2CUDA-Memory(存储)和bank-conflict
2.3CUDA矩阵乘法
3.1 全局存储带宽与合并访问　-- Global Memory(DRAM) bandwidth and memory coalesce
3.2 卷积
3.3分析卷积乘法优化的复用
4.1Reduction模型
4.2 CUDA Reduction 一步一步优化
4.3 Reduction代码(Heterogeneous Parallel Programming class lab)
4.4 CUDA prefix sum一步一步优化
5.1 CUDA atomic原子操作
5.2 CUDA Histogram直方图
6.1 CUDA: pinned memory固定存储
6.2 CUDA streams
7.OpenACC
8.1.C++ AMP简介
8.2 C++ AMP advanced concepts
8.3 MPI
CUDA学习资料分享(随时更新)

posted @ 2015-03-18 10:51 Magnum Programm Life 阅读(3557) 评论(0) 收藏举报

刷新页面返回顶部

公告

博客园 © 2004-2025

浙公网安备 33010602011771号浙ICP备2021040463号-3