会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
MegEngine
博客园
首页
新随笔
联系
订阅
管理
2021年12月16日
深入理解混合精度训练:从 Tensor Core 到 CUDA 编程
摘要: 本文以混合精度训练为切入点,深入挖掘了其背后的 Tensor Core 的原理,并从 CUDA 接口层面和深度学习框架开发两个层面介绍了如何利用 Tensor Core 进行计算加速,最终回归到混合精度训练本身,期望能帮助缺乏 CUDA 编程背景知识的读者对混合精度训练底层逻辑乃至 GPU 加速这个“黑箱”有更深入的理解。
阅读全文
posted @ 2021-12-16 15:07 MegEngine
阅读(1601)
评论(0)
推荐(2)
编辑
公告