2024 年 3月 12 日随笔档案 - DECHIN

2024年3月12日

摘要：

当我们使用GPU进行快速运算时，虽然可以用成熟的深度学习框架如MindSpore和PyTorch等进行实现，但其实从速度上来说，最快不过直接使用C/C++的CUDA来实现。也正是因为如此，在MindSpore框架中支持了对CUDA实现的算子的直接调用，只是在格式规范上有一定的要求。本文主要介绍MindSpore调用本地CUDA算子的一些规范化和技巧。阅读全文

posted @ 2024-03-12 16:31 DECHIN 阅读(159) 评论(0) 推荐(0) 编辑

Dechin的博客

研究兴趣: 分子动力学模拟、量子计算与量子算法、Python编程与深度学习

公告