2024 年 6月 27 日随笔档案 - HuggingFace

2024年6月27日

Hugging Face Accelerate 两个后端的故事：FSDP 与 DeepSpeed

摘要：

社区中有两个流行的零冗余优化器（Zero Redundancy Optimizer，ZeRO）算法实现，一个来自 DeepSpeed，另一个来自 PyTorch。Hugging Face Accelerate 对这两者都进行了集成并通过接口暴露出来，以供最终用户在训练/微调模型时自主选择其中之一阅读全文

posted @ 2024-06-27 23:32 HuggingFace 阅读(1403) 评论(0) 推荐(1) 编辑

更难、更好、更快、更强：LLM Leaderboard v2 现已发布

摘要：摘要评估和比较大语言模型 (LLMs) 是一项艰巨的任务。我们 RLHF 团队在一年前就意识到了这一点，当时他们试图复现和比较多个已发布模型的结果。这几乎是不可能完成的任务：论文或营销发布中的得分缺乏可复现的代码，有时令人怀疑，大多数情况下只是通过优化的提示或评估设置来尽量提升模型表现。因此，他们阅读全文

posted @ 2024-06-27 10:46 HuggingFace 阅读(2252) 评论(0) 推荐(2) 编辑

公告

Hugging Face 官网

昵称： HuggingFace
园龄： 2年2个月
粉丝： 182
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

Hugging Face 博客

The AI community building the future.

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论