摘要: 1、软件层 CUDA从软件层分为流、线程格、线程块、线程。在一次Kernel调用时,需要指定一个grid下划分的block的布局和数量,以及一个block下thread的布局和数量。 cuda stream(流)对应一个任务,存储了一个执行序列,如内存数据交换、执行kernel函数、内存数据交换。如 阅读全文
posted @ 2020-08-17 07:59 茶飘香~ 阅读(529) 评论(0) 推荐(0) 编辑