会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
zwlwf
博客园
首页
新随笔
联系
订阅
管理
2024年10月20日
cuda core实现两个128x128 float矩阵乘法demo
摘要: #include <stdio.h> #include <cuda_runtime.h> // 128 x 128 -> __global__ void mm(float* a, float* b, float* c) { // 8 x 8个方块,每个方块16x16 extern __shared_
阅读全文
posted @ 2024-10-20 20:09 zwlwf
阅读(5)
评论(0)
推荐(0)
编辑
公告