会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Hugging Face 博客
The AI community building the future.
博客园
首页
新随笔
联系
订阅
管理
随笔 - 318
文章 - 3
评论 - 36
阅读 -
25万
2025年2月11日
让 LLM 来评判 | 评估你的评估结果
摘要:
评估你的评估结果 这是 让 LLM 来评判 系列文章的第三篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 在生产中或大规模使用 LLM 评估模型之前,你需要先评估它在目标任务的表现效果如何,确保它的评分跟期望的
阅读全文
posted @ 2025-02-11 21:48 HuggingFace
阅读(75)
评论(0)
推荐(0)
编辑
2025年1月14日
让 LLM 来评判 | 选择 LLM 评估模型
摘要:
基础概念 这是 让 LLM 来评判 系列文章的第一篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 什么是评估模型? 评估模型 (Judge models) 是一种 用于评估其他神经网络的神经网络。大多数情况下它
阅读全文
posted @ 2025-01-14 15:31 HuggingFace
阅读(323)
评论(0)
推荐(1)
编辑
2025年1月11日
让 LLM 来评判 | 基础概念
摘要: 基础概念 这是 让 LLM 来评判 系列文章的第一篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 什么是评估模型? 评估模型 (Judge models) 是一种 用于评估其他神经网络的神经网络。大多数情况下它
阅读全文
posted @ 2025-01-11 20:43 HuggingFace
阅读(211)
评论(0)
推荐(0)
编辑
2025年1月8日
自动评估基准 | 一些评估测试集
摘要:
一些评估测试集 这是 自动评估基准 系列文章的第三篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 如果你感兴趣的任务已经得到充分研究,很可能评估数据集已经存在了。 下面列出了一些近年来开发构建的评估数据集。需要注意的是: 大部分数据集有些 “过时”,因为它们是在
阅读全文
posted @ 2025-01-08 15:27 HuggingFace
阅读(221)
评论(0)
推荐(1)
编辑
2025年1月2日
基于开放模型的推理时计算缩放
摘要:
过去几年,大语言模型 (LLM) 的进程主要由训练时计算缩放主导。尽管这种范式已被证明非常有效,但预训练更大模型所需的资源变得异常昂贵,数十亿美元的集群已经出现。这一趋势引发了人们对其互补方法的浓厚兴趣, 即推理时计算缩放。推理时计算缩放无需日趋庞大的预训练预算,而是采用动态推理策略,让模型能够对难
阅读全文
posted @ 2025-01-02 17:23 HuggingFace
阅读(236)
评论(0)
推荐(1)
编辑
2025年1月1日
自动评估基准 | 技巧与提示
摘要: 过去几年,大语言模型 (LLM) 的进程主要由训练时计算缩放主导。尽管这种范式已被证明非常有效,但预训练更大模型所需的资源变得异常昂贵,数十亿美元的集群已经出现。这一趋势引发了人们对其互补方法的浓厚兴趣, 即推理时计算缩放。推理时计算缩放无需日趋庞大的预训练预算,而是采用动态推理策略,让模型能够对难
阅读全文
posted @ 2025-01-01 00:46 HuggingFace
阅读(184)
评论(0)
推荐(0)
编辑
2024年12月26日
自动评估基准 | 设计你的自动评估任务
摘要:
设计你的自动评估任务 这是 自动评估基准 系列文章的第二篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 选择数据集 做评估时,你可以选择现有的数据集 (参考 一些评估数据集 页面) 作为测试集,也可以设计自己的数据集。有一点非常重要,请注意:评估的结果与评估的数据
阅读全文
posted @ 2024-12-26 21:13 HuggingFace
阅读(124)
评论(0)
推荐(0)
编辑
自动评估基准 | 基础概念
摘要:
基础概念 这是 自动评估基准 系列文章的第一篇,敬请关注系列文章: 基础概念 设计你的自动评估任务 一些评估测试集 技巧与提示 注:本文内容与我写的 通用评估博客 存在部分重叠 什么是自动评估基准? 自动化基准测试通常按照以下方式工作:你希望了解你的模型在某些方面的表现。这些“某些方面”可以是一个明
阅读全文
posted @ 2024-12-26 14:02 HuggingFace
阅读(163)
评论(0)
推荐(1)
编辑
2024年12月19日
人工评估 | 技巧与提示
摘要:
技巧与提示 这是 人工评估 系列文章的第三篇《技巧与提示》,全系列包括: 基础概念 人工标注员 技巧与提示 建议阅读本文之前先阅读 "Using human annotators" 部分。本文将介绍使用人工标注构建评估数据集时的一些实用建议。 任务设计 简单至上:标注任务避免不必要的复杂。将标注员的
阅读全文
posted @ 2024-12-19 14:41 HuggingFace
阅读(240)
评论(0)
推荐(0)
编辑
2024年12月18日
欢迎 PaliGemma 2 – 来自 Google 的新视觉语言模型
摘要: 我们很高兴迎来 Google 全新的视觉语言模型 PaliGemma 2,这是 PaliGemma 的一个新版本。与其前代产品一样,PaliGemma 2 使用强大的 SigLIP 进行视觉处理,但在文本解码部分升级到了最新的 Gemma 2。 模型规模和输入分辨率 PaliGemma 2 提供了新
阅读全文
posted @ 2024-12-18 12:33 HuggingFace
阅读(273)
评论(0)
推荐(0)
编辑
下一页
公告
Hugging Face 官网
昵称:
HuggingFace
园龄:
2年1个月
粉丝:
180
关注:
0
+加关注
<
2025年2月
>
日
一
二
三
四
五
六
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
人工智能
(112)
Hugging Face
(98)
Transformers
(36)
HuggingFace
(25)
LLM
(23)
Hugging News
(23)
stable diffusion
(9)
pytorch
(8)
HuggingNews
(8)
Diffusers
(8)
更多
随笔分类
Hugging Face 博客(177)
HuggingFace博客(5)
HuggingFace博客(2)
随笔档案
2025年2月(1)
2025年1月(5)
2024年12月(9)
2024年11月(5)
2024年10月(9)
2024年9月(9)
2024年8月(9)
2024年7月(10)
2024年6月(10)
2024年5月(11)
2024年4月(11)
2024年3月(10)
2024年2月(11)
2024年1月(10)
2023年12月(11)
2023年11月(11)
2023年10月(10)
2023年9月(10)
2023年8月(20)
2023年7月(20)
2023年6月(17)
2023年5月(19)
2023年4月(19)
2023年3月(23)
2023年2月(17)
2023年1月(17)
2022年12月(4)
阅读排行榜
1. 使用 LoRA 进行 Stable Diffusion 的高效参数微调(11461)
2. Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析(6707)
3. Hugging Face Transformers 萌新完全指南(5820)
4. StarCoder: 最先进的代码大模型(5572)
5. 使用 DeepSpeed 和 Accelerate 进行超快 BLOOM 模型推理(5236)
评论排行榜
1. Hugging Face Transformers 萌新完全指南(3)
2. 使用 SpeechT5 进行语音合成、识别和更多功能(3)
3. Hugging Face 2023 实习生招募计划(3)
4. Hugging Face 论文平台 Daily Papers 功能全解析(2)
5. 使用 LCM LoRA 4 步完成 SDXL 推理(2)
推荐排行榜
1. ChatGPT 设计游戏剧情 | 基于 AI 5 天创建一个农场游戏,完结篇!(5)
2. 现在 Llama 具备视觉能力并可以在你的设备上运行 - 欢迎使用 Llama 3.2(4)
3. 为视觉语言多模态模型进行偏好优化(4)
4. 个人编程助手: 训练你自己的编码助手(4)
5. Diffusers 一岁啦 !(4)
最新评论
1. Re:现在 Llama 具备视觉能力并可以在你的设备上运行 - 欢迎使用 Llama 3.2
话说有没有人微调这个模型来识别数学公式的呢
--布布1314
2. Re:使用 Transformers 为多语种语音识别任务微调 Whisper 模型
可以
--bchuiJNKHJII
3. Re:开源开发者指南:欧盟《人工智能法案》解读
有些国家的AI就是用于上面的这几类风险中的, 人脸识别,催缴的电话外呼,有的公司还为此申请了专利
--码农加一
4. Re:为数据集而生的 SQL 控制台
感谢分享
--潇洒人生梦
5. Re:Hugging Face 论文平台 Daily Papers 功能全解析
支持!!!
--南风丶丶
点击右上角即可分享