上一页 1 2 3 4 5 6 ··· 22 下一页
摘要: 摘要 2024-03-03 周日 杭州 🌤 小记: 钱塘江边的樱花还没有开呀!不过阳光是真的灿烂。 课程内容 1. 什么是 finetuning ? 心得: 基础大模型就是高中毕业前的我们,还没有分专业,所以大模型拥有的是通用的基础能力。微调就像基于对有天赋的孩子的一场专业化训练,微调完成以后的模 阅读全文
posted @ 2024-03-03 10:50 流雨声 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-03-01 周五 杭州 阴雨绵绵 过年回来杭州以后,Sora 就放大招了,我对于生成效果也是感觉惊讶,但是没有像其他人那样吹的天花乱坠,因为我自己体验和试验过 Sora 相关的技术,SD 文生图,大语言模型和视频解码都了解那么一点点,底层确实不很清楚,这次我就要好好学习下,这种东西肯 阅读全文
posted @ 2024-03-01 16:54 流雨声 阅读(59) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-02-14 周三 桑梓 晴 小记: 中文大语言模型训练 课程内容 总结 阅读全文
posted @ 2024-02-14 11:55 流雨声 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-02-11 周日 桑梓 晴 小记: 明知道 AI 将会颠覆一切,但是目前又是风平浪静。 课程内容 1. 大模型三要素 算法: 模型结构,训练方法; 数据: 数据和模型效果之间的关系,token 分词方法; 算力: 英伟达 GPU ,模型量化; 2. 大模型对话系统架构 3. 提示学习 阅读全文
posted @ 2024-02-11 17:47 流雨声 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-02-08 周四 桑梓 小雾 课程内容 1. 基础原理 关键点: 因为技术认知存在问题,所以之前的研究会把 NLP 和 CV 区分开;随着 Transfomer 技术的发展,NLP 和 CV 将会融合在一起。 2. 应用场景 图文匹配 DELL-E 关键词: a. 文字 token 阅读全文
posted @ 2024-02-08 22:34 流雨声 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-02-07 周三 桑梓 晴 小记: 人生如戏,全靠演技; 课程内容 1. 机器学习三大任务 匹配 识别 生成 关键点: 生成模型是下一个 5 年最重要的增长点(工业和学术);生成模型的核心能力可以无中生有,源源不断的进行内容生产,这是一种高级智能。 2. 生成模型的发展路径 难点: 阅读全文
posted @ 2024-02-07 21:53 流雨声 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 摘要 课程内容 1. 整体目标 2. 图像编码器 3. 扩散学习: 从噪声到图片 前向扩散 训练样本生成 降噪还原 图像的重建 模型结构 Unet 文生图 总结 阅读全文
posted @ 2024-02-06 23:06 流雨声 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-02-06 周二 桑梓 阴 课程内容 1. 计算机视觉的任务 技术路线: 目标分割 -> 目标检测 -> 目标识别 -> 目标跟踪 目标分割: 像素级别的对前景与背景进行分类,将背景剔除; 目标检测: 定位目标,确定目标位置及大小; 目标识别: 定性目标,确定目标是什么; 目标跟踪: 阅读全文
posted @ 2024-02-06 22:29 流雨声 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 摘要 2024-02-05 周一 桑梓地 阴 小记: 多模态大模型搞的脑子有点炸呀!!! 课程内容 1. 基础常识 Transformers 在视觉领域中的应用 模型 detr 目标检测 目标: 目标检测 优点: zero-shot,目标检测的类就可以不在训练样本中出现; yolos和detr共同的 阅读全文
posted @ 2024-02-05 16:42 流雨声 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 摘要 一切皆有可能!!! 课程内容 1. 经典分类模型(例如 renet)的问题: a. 类别固定 b. 当前的模型只能胜任一个任务,迁移到新任务上非常困难; c. 类别互斥(softmax) d. 当前的 CV 数据集标注劳动密集,成本高昂; e. 当前的模型泛化能力较差; 2. 双塔架构 0 样 阅读全文
posted @ 2024-02-05 16:08 流雨声 阅读(17) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 22 下一页