会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
冷豆东
2015年3月20日
CUDA学习之二:shared_memory使用,矩阵相乘
摘要: CUDA中使用shared_memory可以加速运算,在矩阵乘法中是一个体现。矩阵C = A * B,正常运算时我们运用 C[i,j] = A[i,:] * B[:,j] 可以计算出结果。但是在CPU上完成这个运算我们需要大量的时间,设A[m,n],B[n,k],那么C矩阵为m*k,总体,我们需要做...
阅读全文
posted @ 2015-03-20 21:48 冷豆东
阅读(5967)
评论(0)
推荐(0)
编辑
导航
博客园
首页
新随笔
联系
订阅
管理
公告