摘要: MindSpore自定义算子中的张量维度问题 当我们使用GPU进行快速运算时,虽然可以用成熟的深度学习框架如MindSpore和PyTorch等进行实现,但其实从速度上来说,最快不过直接使用C/C++的CUDA来实现。也正是因为如此,在MindSpore框架中支持了对CUDA实现的算子的直接调用,只是在格式规范上有一定的要求。本文主要介绍MindSpore调用本地CUDA算子的一些规范化和技巧。 阅读全文
posted @ 2024-03-12 16:31 DECHIN 阅读(159) 评论(0) 推荐(0) 编辑