摘要: 使用Cython调用CUDA Kernel函数 从Python接口调用GPU进行加速的方案有很多,包括Cupy和PyCuda以及之前介绍过的Numba,还可以使用MindSpore、PyTorch和Jax等成熟的深度学习框架,这里介绍了一种直接写CUDA Kernel函数的方案。为了能够做到CUDA-C和Python编程的分离,这里引入了Cython作为中间接口,这样一来Python开发者和C开发者可以去共同开发相应的高性能方法。 阅读全文
posted @ 2024-08-02 14:32 DECHIN 阅读(269) 评论(0) 推荐(0) 编辑