Hugging Face 博客

Quanto: PyTorch 量化工具包

摘要：量化技术通过用低精度数据类型 (如 8 位整型 (int8)) 来表示深度学习模型的权重和激活，以减少传统深度学习模型使用 32 位浮点 (float32) 表示权重和激活所带来的计算和内存开销。减少位宽意味着模型的内存占用更低，这对在消费设备上部署大语言模型至关重要。量化技术也使得我们可以针对较阅读全文

posted @ 2024-04-09 23:47 HuggingFace 阅读(1050) 评论(0) 推荐(1) 编辑

利用 🤗 Optimum Intel 和 fastRAG 在 CPU 上优化文本嵌入

摘要：嵌入模型在很多场合都有广泛应用，如检索、重排、聚类以及分类。近年来，研究界在嵌入模型领域取得了很大的进展，这些进展大大提高了基于语义的应用的竞争力。BGE、GTE 以及 E5 等模型在 MTEB 基准上长期霸榜，在某些情况下甚至优于私有的嵌入服务。 Hugging Face 模型 hub 提供了多种阅读全文

posted @ 2024-04-02 19:05 HuggingFace 阅读(324) 评论(0) 推荐(0) 编辑

在 NVIDIA DGX Cloud 上使用 H100 GPU 轻松训练模型

摘要：在 NVIDIA DGX Cloud上使用 H100 GPU 轻松训练模型今天，我们正式宣布推出 DGX 云端训练 (Train on DGX Cloud) 服务，这是 Hugging Face Hub 上针对企业 Hub 组织的全新服务。通过在 DGX 云端训练，你可以轻松借助 NVIDIA 阅读全文

posted @ 2024-03-21 10:19 HuggingFace 阅读(335) 评论(0) 推荐(0) 编辑

数据好合: Argilla 和 Hugging Face Spaces 携手赋能社区合力构建更好的数据集

摘要：最近，Argilla 和 Hugging Face 共同推出了 Data is Better Together 计划，旨在凝聚社区力量协力构建一个对提示进行排名的偏好数据集。仅用几天，我们就吸引了: 350 个社区贡献者参与数据标注超过 11,000 个提示评分你可通过进度面板了解最新的阅读全文

posted @ 2024-03-20 09:58 HuggingFace 阅读(191) 评论(0) 推荐(1) 编辑

TTS 擂台: 文本转语音模型的自由搏击场

摘要：对文本转语音 (text-to-speech, TTS) 模型的质量进行自动度量非常困难。虽然评估声音的自然度和语调变化对人类来说是一项微不足道的任务，但对人工智能来说要困难得多。为了推进这一领域的发展，我们很高兴推出 TTS 擂台。其灵感来自于 LMSys 为 LLM 提供的 Chatbot 擂台阅读全文

posted @ 2024-03-16 13:14 HuggingFace 阅读(429) 评论(1) 推荐(2) 编辑

基于英特尔® Gaudi® 2 AI 加速器的文本生成流水线

摘要：随着生成式人工智能 (Generative AI，GenAI) 革命的全面推进，使用 Llama 2 等开源 transformer 模型生成文本已成为新风尚。人工智能爱好者及开发人员正在寻求利用此类模型的生成能力来赋能不同的场景及应用。本文展示了如何基于 Optimum Habana 以及我们实现阅读全文

posted @ 2024-03-13 23:41 HuggingFace 阅读(214) 评论(0) 推荐(1) 编辑

来自 AI Secure 实验室的 LLM 安全排行榜简介

摘要：近来，LLM 已深入人心，大有燎原之势。但在我们将其应用于千行百业之前，理解其在不同场景下的安全性和潜在风险显得尤为重要。为此，美国白宫发布了关于安全、可靠、可信的人工智能的行政命令; 欧盟人工智能法案也对高风险人工智能系统的设立了专门的强制性要求。在这样的大背景下，我们首先需要确立一个用于定量评估阅读全文

posted @ 2024-03-12 22:35 HuggingFace 阅读(360) 评论(0) 推荐(1) 编辑

俄罗斯套娃 (Matryoshka) 嵌入模型概述

摘要：在这篇博客中，我们将向你介绍俄罗斯套娃嵌入的概念，并解释为什么它们很有用。我们将讨论这些模型在理论上是如何训练的，以及你如何使用 Sentence Transformers 来训练它们。除此之外，我们还会告诉你怎么用这种像套娃一样的俄罗斯套娃嵌入模型，并且我们会比较一下这种模型和普通嵌入模型的不同阅读全文

posted @ 2024-03-06 21:59 HuggingFace 阅读(654) 评论(0) 推荐(1) 编辑

合成数据: 利用开源技术节约资金、时间和减少碳排放

摘要：简单概括你应该使用自己的模型，还是使用 LLM API？创建你自己的模型可以让你完全控制，但需要数据收集、训练和部署方面的专业知识。LLM API 使用起来更简单，但会将数据发送给第三方，并对提供商有强烈依赖。这篇博客让你可以将 LLM 的便利性与定制模型的控制性和效率相结合。在一个关于识别新闻阅读全文

posted @ 2024-03-06 10:35 HuggingFace 阅读(314) 评论(0) 推荐(1) 编辑

企业场景排行榜简介: 现实世界用例排行榜

摘要：企业场景排行榜简介: 现实世界用例排行榜今天，Patronus 团队很高兴向社区发布我们与 Hugging Face 合作完成的、基于 Hugging Face 排行榜模板构建的、新的企业场景排行榜。本排行榜旨在评估语言模型在企业现实用例中的性能。目前已支持 6 类任务，涵盖: 金融、法律保阅读全文

posted @ 2024-03-05 10:34 HuggingFace 阅读(317) 评论(0) 推荐(1) 编辑

开源代码生成模型 StarCoder 2 全新上线！

摘要：BigCode 正式推出 StarCoder2 —— 一系列新一代的开放源代码大语言模型 (LLMs)。这些模型全部基于一个全新、大规模且高品质的代码数据集 The Stack v2 进行训练。我们不仅公开了所有的模型和数据集，还包括了数据处理和训练代码的详细信息，详情请参阅相关论文。 StarC 阅读全文

posted @ 2024-03-05 10:20 HuggingFace 阅读(1778) 评论(0) 推荐(0) 编辑

Hugging Face 表情包来啦！

摘要：小编有一个朋友，微信聊基本不回复文字，内容和情绪都化身成表情包直接回复，并且一气呵成、自带上下文衔接。你身边有这样的朋友吗？作为梦想成为第一家以表情符号上市的公司，以及在社交平台发文 emoji 不离手的 Hugging Face，正式为中国社区成员们带来了一套软萌的 Hugging Face 表阅读全文

posted @ 2024-03-05 09:08 HuggingFace 阅读(137) 评论(0) 推荐(0) 编辑

使用 Hugging Face 微调 Gemma 模型

摘要：我们最近宣布了，来自 Google Deepmind 开放权重的语言模型 Gemma现已通过 Hugging Face 面向更广泛的开源社区开放。该模型提供了两个规模的版本：20 亿和 70 亿参数，包括预训练版本和经过指令调优的版本。它在 Hugging Face 平台上提供支持，可在 Verte 阅读全文

posted @ 2024-02-25 10:46 HuggingFace 阅读(2134) 评论(0) 推荐(1) 编辑

小红书 x Hugging Face 邀请你一起晒「创意新春照」

摘要：不藏了，近期全网爆火的AI 写真项目 InstantID，正是来自小红书社区技术创作发布团队。为了迎接龙年春节的到来，我们的InstantID全新推出「Spring Festival」新春风格！并与著名开源模型社区 Hugging Face 联手，在小红书 APP 上，特别策划「你的新春照我包了阅读全文

posted @ 2024-02-24 22:41 HuggingFace 阅读(246) 评论(0) 推荐(2) 编辑

欢迎 Gemma: Google 最新推出开源大语言模型

摘要：今天，Google 发布了一系列最新的开放式大型语言模型 —— Gemma！Google 正在加强其对开源人工智能的支持，我们也非常有幸能够帮助全力支持这次发布，并与 Hugging Face 生态完美集成。 Gemma 提供两种规模的模型：7B 参数模型，针对消费级 GPU 和 TPU 设计，确保阅读全文

posted @ 2024-02-22 22:23 HuggingFace 阅读(742) 评论(0) 推荐(0) 编辑

开源大语言模型作为 LangChain 智能体

摘要：概要开源大型语言模型 (LLMs) 现已达到一种性能水平，使它们适合作为推动智能体工作流的推理引擎: Mixtral 甚至在我们的基准测试中超过了 GPT-3.5，并且通过微调，其性能可以轻易的得到进一步增强。引言针对因果语言建模训练的大型语言模型 (LLMs) 可以处理广泛的任务，但它阅读全文

posted @ 2024-02-22 21:42 HuggingFace 阅读(1375) 评论(1) 推荐(3) 编辑

使用 🤗 Optimum Intel 在英特尔至强上加速 StarCoder: Q8/Q4 及投机解码

摘要：引言近来，随着 BigCode 的 StarCoder 以及 Meta AI 的 Code Llama 等诸多先进模型的发布，代码生成模型变得炙手可热。同时，业界也涌现出了大量的致力于优化大语言模型 (LLM) 的运行速度及易用性的工作。我们很高兴能够分享我们在英特尔至强 CPU 上优化 LLM 阅读全文

posted @ 2024-02-20 21:14 HuggingFace 阅读(146) 评论(0) 推荐(0) 编辑

LLaMA 2 - 你所需要的一切资源

摘要：摘录关于 LLaMA 2 的全部资源，如何去测试、训练并部署它。 LLaMA 2 是一个由 Meta 开发的大型语言模型，是 LLaMA 1 的继任者。LLaMA 2 可通过 AWS、Hugging Face 等提供商获取，并免费用于研究和商业用途。LLaMA 2 预训练模型在 2 万亿个标记上进阅读全文

posted @ 2024-02-19 21:08 HuggingFace 阅读(907) 评论(1) 推荐(2) 编辑

听说有 Hugging Face 陪伴的春节，是这样的…

摘要：辞旧迎新春节到，家家户户好热闹。Hugging Face 中国团队成员祝各位社区成员们新春快乐，万事如意！过去的一年我们持续看到 AI 技术的腾飞和发展，以及诸多机构为开源 AI 作出巨大的贡献。非常感谢将模型、数据集和应用 Demo 发布在 Hugging Face 上的团队，新的一年，我们也会阅读全文

posted @ 2024-02-09 12:38 HuggingFace 阅读(66) 评论(0) 推荐(0) 编辑

扩展说明: 指令微调 Llama 2

摘要：这篇博客是一篇来自 Meta AI，关于指令微调 Llama 2 的扩展说明。旨在聚焦构建指令数据集，有了它，我们则可以使用自己的指令来微调 Llama 2 基础模型。目标是构建一个能够基于输入内容来生成指令的模型。这么做背后的逻辑是，模型如此就可以由其他人生成自己的指令数据集。这在当想开发私人个阅读全文

posted @ 2024-02-08 17:01 HuggingFace 阅读(1715) 评论(0) 推荐(0) 编辑

The AI community building the future.

随笔分类 - Hugging Face 博客

公告