摘要: 如下图,将多个执行相同核函数的进程通过cuda流来使他们并发执行,提升效率 这很像cpu的流水线 想让下面这个核函数执行两次,每次都是不同的参数 我们需要用到cuda的流来并发的执行提升效率 __global__ void kernel( int *a, int *b, int *c ) { int 阅读全文
posted @ 2024-03-31 11:11 拾墨、 阅读(12) 评论(0) 推荐(0) 编辑