随笔分类 - CUDA
摘要:首先挂上colab网址:这里. 果不其然刚开始就出现了问题. inputs = tokenizer('A cat in French is "', return_tensors="pt")["input_ids"].cuda() outputs = model.generate(inputs, ma
阅读全文
摘要:最近在读professional cuda c programming.第三章里有一些关于nvprof的内容.记录一下过程中遇到的问题. 本书的代码可以在这里找到. 线程束分化 GPU在控制流上相对简单,相比GPU它没有复杂的分支预测机制,一个warp中所有线程在同一周期内必须执行相同指令.如果一个
阅读全文
摘要:今天我们来讲解一下CUDA当中,Runtime和Driver的联系与区别. 上图表示了CUDA程序调用中间API的层次结构和所处设备情况. 可以看出,CUDA提供的接口分三个层次: CUDA Library, CUDA Runtime 和CUDA Driver. 而我们的程序可以在任意一个层次上调用
阅读全文
摘要:git clone https://github.com/CodedK/CUDA-by-Example-source-code-for-the-book-s-examples-.git 首先是报错 nvcc -o ray ray.cu In file included from ../common/
阅读全文