会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
anluo8
博客园
首页
新随笔
联系
订阅
管理
随笔 - 25
文章 - 0
评论 - 0
阅读 -
1037
2025年1月4日
高性能计算-CUDA矩阵加法及优化测试(23)
摘要: 1. 目标:对 16384*16384 规模的矩阵进行加法运算,对比 CPU 和 GPU 计算的效率,还有不同线程块大小规模下对效率的影响;并做可能的优化测试。 2. 核心代码 /* 用GPU对二维矩阵做加法,分析不同线程块规模下的性能变化 */ #include <stdio.h> #includ
阅读全文
posted @ 2025-01-04 16:21 安洛8
阅读(36)
评论(0)
推荐(0)
编辑
公告
昵称:
安洛8
园龄:
5年5个月
粉丝:
0
关注:
3
+加关注
搜索
最新随笔
1.高性能计算-GPU单进程多卡(多流)并行计算编程模型示例(25)
2.高性能计算-CUDA单流/多流调度(24)
3.高性能计算-CUDA矩阵加法及优化测试(23)
4.高性能计算-CUDA一维信号均值滤波及内存优化(22)
5.高性能计算-GPU编程模型(21)
6.高性能计算-Intel IPP库ARM移植示例(20)
7.高性能计算-粒子状态模拟计算-性能优化(19)
8.高性能计算-NEON-图像旋转(18)
9.高性能计算-NEON-intrinsic函数(17)
10.高性能计算-gemv-向量化优化(16)
我的标签
高性能计算
(23)
并行计算
(23)
SIMD
(7)
openmp
(7)
NEON
(7)
GPU
(5)
程序优化
(4)
gemm优化
(3)
CUDA
(3)
CUDA内存模型
(2)
更多
随笔分类
高性能计算(25)
随笔档案
2025年2月(1)
2025年1月(2)
2024年12月(7)
2024年11月(8)
2024年10月(7)
阅读排行榜
1. 高性能计算-bgra2rgb转换-向量化优化(15)(112)
2. 高性能计算-gemm-mpi并行计算优化(8)(93)
3. 高性能计算-Intel IPP库ARM移植示例(20)(79)
4. 高性能计算-gemv-向量化优化(16)(77)
5. 高性能计算-openmp-多线程缓存一致性(9)(68)
点击右上角即可分享