会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
KK4SBB
风来疏竹,风过而竹不留声;雁渡寒潭,雁去而潭不留影。
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2024年5月8日
Lora训练的参数和性能
摘要: 主要为了测试模型增加Lora模块后,参数量和训练速度的变化情况。结论:正常情况下,增加Lora模块是会增加参数量的,因此前向传播和反向传播的时间也会增加。但是,在大语言模型训练的情况下,因为基础模型本身参数量非常大,Lora模块增加的参数量相对非常小。并且,基础模型不参与梯度更新,可以做模型量化,实
阅读全文
posted @ 2024-05-08 15:27 KK4SBB
阅读(344)
评论(0)
推荐(0)
编辑