12 2024 档案
摘要:
设计你的自动评估任务 这是 自动评估基准 系列文章的第二篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 选择数据集 做评估时,你可以选择现有的数据集 (参考 一些评估数据集 页面) 作为测试集,也可以设计自己的数据集。有一点非常重要,请注意:评估的结果与评估的数据
阅读全文
![自动评估基准 | 设计你的自动评估任务](https://img2024.cnblogs.com/blog/3075972/202412/3075972-20241226210943983-1945719925.png)
摘要:
基础概念 这是 自动评估基准 系列文章的第一篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 注:本文内容与我写的 通用评估博客 存在部分重叠 什么是自动评估基准? 自动化基准测试通常按照以下方式工作:你希望了解你的模型在某些方面的表现。这些“某些方面”可以是一个明
阅读全文
![自动评估基准 | 基础概念](https://img2024.cnblogs.com/blog/3075972/202412/3075972-20241226135810465-1468488812.png)
摘要:
技巧与提示 这是 人工评估 系列文章的第三篇《技巧与提示》,全系列包括: 基础概念 人工标注员 技巧与提示 建议阅读本文之前先阅读 "Using human annotators" 部分。本文将介绍使用人工标注构建评估数据集时的一些实用建议。 任务设计 简单至上:标注任务避免不必要的复杂。将标注员的
阅读全文
![人工评估 | 技巧与提示](https://img2024.cnblogs.com/blog/3075972/202412/3075972-20241219143726646-2103097902.png)
摘要:我们很高兴迎来 Google 全新的视觉语言模型 PaliGemma 2,这是 PaliGemma 的一个新版本。与其前代产品一样,PaliGemma 2 使用强大的 SigLIP 进行视觉处理,但在文本解码部分升级到了最新的 Gemma 2。 模型规模和输入分辨率 PaliGemma 2 提供了新
阅读全文
摘要:
这次我们的 LeRobot 团队联合 @therobotstudio 和 @NepYope 打造了全新腱驱动(Tendon-driven)技术,以快、更准、更灵活的超凡表现,让机器人手部控制进入全新时代! 💡 当前该机器手的自由度:手部16,手臂 7。 💵 机器手价格不超过450美元 最让人激动
阅读全文
![Hugging Face 机器人技术新突破](https://img2024.cnblogs.com/blog/3075972/202412/3075972-20241218105228362-1489716655.png)
摘要:
人工标注员 这是 人工评估 系列文章的第二篇《人工标注员》,全系列包括: 基础概念 人工标注员 技巧与提示 推荐阅读 这篇综述 的第三章,介绍了许多数据标注质量管理的实践经验。如果你追求的是生产级的质量,并且具备实施条件,那么请继续阅读吧! 无论项目规模多大,一旦定义了具体的评估任务和打分细则,请注
阅读全文
![人工评估 | 人工标注员](https://img2024.cnblogs.com/blog/3075972/202412/3075972-20241213120128024-228298881.png)
摘要:
基础概念 这是 人工评估 系列文章的第一篇《基础概念》,全系列包括: 基础概念 人工标注员 技巧与提示 什么是人工评估? 人工评估是指让人类评价模型输出回答的好坏。 本文讨论的都是后验评估,即模型已经完成训练,给定一个任务让人类进行评估。 系统化评估 系统化的人工评估主要有 3 种方式: 如果你手头
阅读全文
![人工评估 | 基础概念](https://img2024.cnblogs.com/blog/3075972/202412/3075972-20241212101256270-1522688915.png)
摘要:非法律建议。 欧盟《人工智能法案》 (EU AI Act) 是全球首部全面的人工智能立法,现已正式生效,它将影响我们开发和使用人工智能的方式——包括在开源社区中的实践。如果您是一位开源开发者,正在适应这一新环境,可能会想知道这对您的项目意味着什么。本指南重点解读了该法规的关键要点,特别是针对开源开发
阅读全文
摘要:
Gall 定律 一个有效的复杂系统通常是从一个有效的简单系统演化而来的 —— John Gall 本文将带你一步步探究 Transformer 模型中先进的位置编码技术。我们将通过迭代改进编码位置的方法,最终得出 旋转位置编码 (Rotary Postional Encoding, RoPE),这也
阅读全文
![设计位置编码](https://img2024.cnblogs.com/blog/3075972/202412/3075972-20241203213201061-711187033.png)