摘要: 摘要 2024-02-05 周一 桑梓地 阴 小记: 多模态大模型搞的脑子有点炸呀!!! 课程内容 1. 基础常识 Transformers 在视觉领域中的应用 模型 detr 目标检测 目标: 目标检测 优点: zero-shot,目标检测的类就可以不在训练样本中出现; yolos和detr共同的 阅读全文
posted @ 2024-02-05 16:42 流雨声 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 摘要 一切皆有可能!!! 课程内容 1. 经典分类模型(例如 renet)的问题: a. 类别固定 b. 当前的模型只能胜任一个任务,迁移到新任务上非常困难; c. 类别互斥(softmax) d. 当前的 CV 数据集标注劳动密集,成本高昂; e. 当前的模型泛化能力较差; 2. 双塔架构 0 样 阅读全文
posted @ 2024-02-05 16:08 流雨声 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-02-05 周一 老家 晴 小记: 多模态大语言模型才是未来,多模态不过也是各个模态的组合,未来已来。 课程内容 1. 多模态入门: vit 模型 vit: Vision Transforms 2. CNN vs Transforms 用神经网络对图像进行分类; 越靠近输入的网络,越 阅读全文
posted @ 2024-02-05 15:31 流雨声 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-02-05 周一 老家 阴晴不定 课程内容 1. ChatGLM-6B 简介 关键词: 1B = 10 亿 2. ChatGLM-6B 资源规格 3. ChatGLM-6B 微调代码 4. Lora 技术原理 关键词: 模型公式为 Z=WX+wX ,因为 W 相对来说比较大,因此通过 阅读全文
posted @ 2024-02-05 12:48 流雨声 阅读(61) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-02-05 周一 老家 阴转晴 小记: llama与gpt的关系,如何做一个属于自己的大模型,对于业务没啥兴趣,业务就是动态变化的,但是大模型想要落地还是要和业务结合才可以。 课程内容 1. 羊驼简介 a. 羊驼是开源的大语言模型,相当于移动互联网时代的安卓(os: 工程师不小心放出 阅读全文
posted @ 2024-02-05 11:42 流雨声 阅读(114) 评论(0) 推荐(0) 编辑