01 2025 档案

摘要:1. 介绍: (1) 用CUDA计算 pow(sin(id),2)+ pow(cos(id),2)的结果 (2) 对比单流(同步传输、异步传输)、多流深度优先调度、多流广度优先调度的效率(包含数据传输和计算) 核心代码 1. 用CUDA计算 pow(sin(id),2)+ pow(cos(id),2 阅读全文
posted @ 2025-01-07 11:48 安洛8 阅读(40) 评论(0) 推荐(0) 编辑
摘要:1. 目标:对 16384*16384 规模的矩阵进行加法运算,对比 CPU 和 GPU 计算的效率,还有不同线程块大小规模下对效率的影响;并做可能的优化测试。 2. 核心代码 /* 用GPU对二维矩阵做加法,分析不同线程块规模下的性能变化 */ #include <stdio.h> #includ 阅读全文
posted @ 2025-01-04 16:21 安洛8 阅读(31) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示