04 2019 档案

摘要:0 引言 cuda线程模型涉及grid的块划分和线程配置,直接影响到全局运算速度。根据文档《CUDA_C_Programming_Guide》,性能优化有三个方面的基本策略。 (1)最大化并行执行以实现最大的利用率. (2)优化内存使用,以实现最大的内存吞吐量. (3)优化指令使用,以实现最大的指令 阅读全文
posted @ 2019-04-10 12:42 十步一杀2017 阅读(713) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示