会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
anluo8
博客园
首页
新随笔
联系
订阅
管理
随笔 - 25
文章 - 0
评论 - 0
阅读 -
1037
2025年1月7日
高性能计算-CUDA单流/多流调度(24)
摘要: 1. 介绍: (1) 用CUDA计算 pow(sin(id),2)+ pow(cos(id),2)的结果 (2) 对比单流(同步传输、异步传输)、多流深度优先调度、多流广度优先调度的效率(包含数据传输和计算) 核心代码 1. 用CUDA计算 pow(sin(id),2)+ pow(cos(id),2
阅读全文
posted @ 2025-01-07 11:48 安洛8
阅读(43)
评论(0)
推荐(0)
编辑
公告
昵称:
安洛8
园龄:
5年5个月
粉丝:
0
关注:
3
+加关注
搜索
最新随笔
1.高性能计算-GPU单进程多卡(多流)并行计算编程模型示例(25)
2.高性能计算-CUDA单流/多流调度(24)
3.高性能计算-CUDA矩阵加法及优化测试(23)
4.高性能计算-CUDA一维信号均值滤波及内存优化(22)
5.高性能计算-GPU编程模型(21)
6.高性能计算-Intel IPP库ARM移植示例(20)
7.高性能计算-粒子状态模拟计算-性能优化(19)
8.高性能计算-NEON-图像旋转(18)
9.高性能计算-NEON-intrinsic函数(17)
10.高性能计算-gemv-向量化优化(16)
我的标签
高性能计算
(23)
并行计算
(23)
SIMD
(7)
openmp
(7)
NEON
(7)
GPU
(5)
程序优化
(4)
gemm优化
(3)
CUDA
(3)
CUDA内存模型
(2)
更多
随笔分类
高性能计算(25)
随笔档案
2025年2月(1)
2025年1月(2)
2024年12月(7)
2024年11月(8)
2024年10月(7)
阅读排行榜
1. 高性能计算-bgra2rgb转换-向量化优化(15)(112)
2. 高性能计算-gemm-mpi并行计算优化(8)(93)
3. 高性能计算-Intel IPP库ARM移植示例(20)(79)
4. 高性能计算-gemv-向量化优化(16)(77)
5. 高性能计算-openmp-多线程缓存一致性(9)(68)
点击右上角即可分享