随笔分类 - 深度学习 / 多模态

【笔记】李沐视频：大模型时代下做科研的四个思路

摘要：LLaMA 最近开源，分别开源了 7e9, 1.3e10, 3.3e10, 6.5e10 四个参数量的模型。但是这里有意思的是，他们管自己的模型称为 smaller models。 Google 推出了 22B 的 ViT 1. Efficient（PEFT）简要概括更高效，哪里慢就让它快起来阅读全文

posted @ 2023-03-25 16:12 bringlu 阅读(1148) 评论(0) 推荐(0)

李沐多模态串讲视频总结 ALBEF VLMo BLIP CoCa BEITv3 模型简要介绍

摘要：开场多模态串讲的上篇是比较传统的多模态任务多模态最后的模态交互很重要传统的缺点是都用了预训练的目标检测器，训练和部署都很困难。 ViLT 把预训练的目标检测器换成了一层的 Patch Embedding。因此容易比不过 c 类的方法 ViLT 训练很慢认为未来是 c 类的模型结构 Loss 阅读全文

posted @ 2023-03-19 08:36 bringlu 阅读(3533) 评论(0) 推荐(1)

Loading

bringlu

随笔分类 - 深度学习 / 多模态

公告