摘要: 首先需要知道nvcc编译过程 cuda => ptx =>SASS (assemble,actually binary) 因此,ptx作为中间层,可以起到缓冲并且兼容的功能。 -arch就是ptx的版本 -code就是sass的版本 因此,如shfl指令在volta上不再支持,(需要shfl.syn 阅读全文
posted @ 2021-12-16 14:44 xuyv 阅读(244) 评论(0) 推荐(0) 编辑