随笔档案「2024年1月」 - HuggingFace

随机 Transformer

摘要：在这篇博客中，我们将通过一个端到端的示例来讲解 Transformer 模型中的数学原理。我们的目标是对模型的工作原理有一个良好的理解。为了使内容易于理解，我们会进行大量简化。我们将减少模型的维度，以便我们可以手动推理模型的计算过程。例如，我们将使用 4 维的嵌入向量代替原始的 512 维嵌入向量。阅读全文

posted @ 2024-01-29 21:44 HuggingFace 阅读(501) 评论(0) 推荐(0)

最新 Hugging Face 强化学习课程（中文版）来啦！

摘要：人工智能中最引人入胜的话题莫过于深度强化学习 (Deep Reinforcement Learning) 了，我们在 2022 年 12 月 5 日开启了《深度强化学习课程 v2.0》的课程学习，有来自全球众多学员们的参加。课程已经完成更新，并且发布在 Hugging Face 官网 https:/ 阅读全文

posted @ 2024-01-28 15:17 HuggingFace 阅读(1175) 评论(0) 推荐(1)

SetFitABSA: 基于 SetFit 的少样本、方面级情感分析

摘要：

SetFitABSA 是一种可以有效从文本中检测方面级情感的技术。方面级情感分析 (Aspect-Based Sentiment Analysis，ABSA) 是一种检测文本中特定方面的情感的任务。例如，在“这款手机的屏幕很棒，但电池太小”一句中，分别有“屏幕”和“电池”两个方面，它们的情感极性分阅读全文

posted @ 2024-01-19 09:26 HuggingFace 阅读(482) 评论(0) 推荐(0)

给科研人的 ML 开源发布工具包

摘要：什么是开源发布工具包？恭喜你的论文成功发表，这是一个巨大的成就！你的研究成果将为学界做出贡献。其实除了发表论文之外，你还可以通过发布研究的其他部分，如代码、数据集、模型等，来增加研究的可见度和采用率。这将使更多人能够使用你的研究，并推动研究成果的应用。我们整理了这份文件，让你可以更好的了解和实阅读全文

posted @ 2024-01-17 23:20 HuggingFace 阅读(913) 评论(0) 推荐(2)

开放 LLM 排行榜: 深入研究 DROP

摘要：最近，开放 LLM 排行榜迎来了 3 个新成员: Winogrande、GSM8k 以及 DROP，它们都使用了 EleutherAI Harness 的原始实现。一眼望去，我们就会发现 DROP 的分数有点古怪: 绝大多数模型的 F1 分数都低于 10 分 (满分 100 分)！我们对此进行了深阅读全文

posted @ 2024-01-15 23:09 HuggingFace 阅读(988) 评论(0) 推荐(0)

Hugging Face CEO: 2024 将是AI丰收年

摘要：来自CEO的新年祝福 ❤️附加了他对于2024年人工智能界的四大预测你觉得2024年人工智能和机器学习界会是什么样的呢？欢迎留言阅读全文

posted @ 2024-01-12 11:20 HuggingFace 阅读(119) 评论(0) 推荐(0)

使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速

摘要：Open AI 推出的 Whisper 是一个通用语音转录模型，在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜，被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据集的 58 种语言中也展现出了强大的多语言性能，在阅读全文

posted @ 2024-01-10 22:48 HuggingFace 阅读(1377) 评论(0) 推荐(0)

非工程师指南: 训练 LLaMA 2 聊天机器人

摘要：引言本教程将向你展示在不编写一行代码的情况下，如何构建自己的开源 ChatGPT，这样人人都能构建自己的聊天模型。我们将以 LLaMA 2 基础模型为例，在开源指令数据集上针对聊天场景对其进行微调，并将微调后的模型部署到一个可分享的聊天应用中。全程只需点击鼠标，即可轻松通往荣耀之路！😀 为什么这阅读全文

posted @ 2024-01-06 00:55 HuggingFace 阅读(594) 评论(0) 推荐(0)

Huggy Lingo: 利用机器学习改进 Hugging Face Hub 上的语言元数据

摘要：太长不看版: Hub 上有不少数据集没有语言元数据，我们用机器学习来检测其语言，并使用 librarian-bots 自动向这些数据集提 PR 以添加其语言元数据。 Hugging Face Hub 已成为社区共享机器学习模型、数据集以及应用的存储库。随着 Hub 上的数据集越来越多，元数据，作为一阅读全文

posted @ 2024-01-04 21:26 HuggingFace 阅读(196) 评论(0) 推荐(0)

欢迎 Mixtral - 当前 Hugging Face 上最先进的 MoE 模型

摘要：最近，Mistral 发布了一个激动人心的大语言模型: Mixtral 8x7b，该模型把开放模型的性能带到了一个新高度，并在许多基准测试上表现优于 GPT-3.5。我们很高兴能够在 Hugging Face 生态系统中全面集成 Mixtral 以对其提供全方位的支持 🔥！ Hugging Fac 阅读全文

posted @ 2024-01-04 12:27 HuggingFace 阅读(1709) 评论(0) 推荐(0)

Hugging Face 博客

The AI community building the future.

01 2024 档案

公告