摘要: 1、线程 之前的向量加法和乘法例子中,都是采用N个块,每个块1个线程,或者1个块,N个线程来进行GPU的并行计算。但现实中一般都是一次并行启动多个块,每个块里面多个线程(最多为maxThreadPerBlock)。如果maxThreadPerBlock=512,需要并行的任务为N,可以这样调用内核: 阅读全文
posted @ 2021-09-11 09:09 ChangYuanD 阅读(37) 评论(0) 推荐(0) 编辑