会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
红豆生南国 是很遥远的事情
种豆南山下 github
博客园
首页
新随笔
联系
订阅
管理
2024年11月5日
大模型-训练推理 模型大小与硬件GPU 选取的大致关系-05
摘要: 目录0. 计算公式1. 市面上常见的显卡2. 训练3. 推理 0. 计算公式 重点:显存大小 = 模型参数占用 + 梯度占用 + 优化器占用 + CUDA kernel占用 + 中间计算结果 每个神经元节点 不仅仅有自身的权重值 在进行反向传播的时候还有梯度的累计值 1. 市面上常见的显卡 英伟达G
阅读全文
posted @ 2024-11-05 00:13 jack-chen666
阅读(60)
评论(0)
推荐(0)
编辑
公告