会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
王二
首页
新随笔
联系
订阅
管理
2024年8月10日
Turbo Sparse:关于LLM稀疏性的探索
摘要:
本文地址:https://wanger-sjtu.github.io/TurboSparse/ 关于llama稀疏性的观察 llama原始模型的FFN计算过程为: \[f(x) = \text{silu}(xW_{Gate}) \odot xW_{UP} \times W_{Down} \]clas
阅读全文
posted @ 2024-08-10 22:52 青铜时代的猪
阅读(162)
评论(0)
推荐(0)
编辑
公告