Alway|

KeanShi

园龄:1年7个月粉丝:4关注:0

【杂学】知识蒸馏原理解读
摘要: 知识蒸馏技术(Knowledge Distillation,KD)原理解读
82
0
0
【代码】LLaVA 代码学习与调试
摘要: 从代码角度详解LLaVA
628
0
0
【代码】LLaVA 代码运行记录
摘要: LLaVA & LLaVolta 代码排坑指南
168
0
0
【论文阅读笔记】多模态大语言模型必读 —— LLaVA
摘要: LLaVA (Large Language and Vision Assistant),proposed by Haotian Liu (UWM), et al.
312
0
0
【杂学】大模型推理加速 —— KV-cache 技术
摘要: 大模型推理加速技术 —— KV-cache 详细图解与公式推导
266
0
0
【论文阅读笔记】大模型推理加速 —— FastV
摘要: FastV, a plug-and-play method proposed by Liang Chen (ICL, Peking University), et al.
128
0
0
【论文阅读笔记】大模型微调 —— LoRA
摘要: LoRA: Low-Rank Adaptation of Large Language Models
403
0
0
点击右上角即可分享
微信分享提示
深色
回顶
收起