随笔档案「2023年10月」 - HuggingFace

实战｜如何低成本训练一个可以超越 70B Llama2 的模型 Zephyr-7B

摘要：每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。快来看看有哪些近期更新吧！ 🎉 新的训练方法 Zephyr-7B 模型超越 70B Lla 阅读全文

posted @ 2023-10-28 01:23 HuggingFace 阅读(731) 评论(0) 推荐(0)

长程 Transformer 模型

摘要：Tay 等人的 Efficient Transformers taxonomy from Efficient Transformers: a Survey 论文本文由 Teven Le Scao、Patrick Von Platen、Suraj Patil、Yacine Jernite 和 Vic 阅读全文

posted @ 2023-10-26 22:02 HuggingFace 阅读(339) 评论(0) 推荐(0)

使用 DDPO 在 TRL 中微调 Stable Diffusion 模型

摘要：引言扩散模型 (如 DALL-E 2、Stable Diffusion) 是一类文生图模型，在生成图像 (尤其是有照片级真实感的图像) 方面取得了广泛成功。然而，这些模型生成的图像可能并不总是符合人类偏好或人类意图。因此出现了对齐问题，即如何确保模型的输出与人类偏好 (如“质感”) 一致，或者与那阅读全文

posted @ 2023-10-23 23:04 HuggingFace 阅读(892) 评论(0) 推荐(0)

Hugging Face: 代码生成模型的预训练和微调

摘要：和大家分享我们的机器学习工程师 Loubna Ben Allal 在 10 月上海 KubeCon 大会的主题演讲 📢 题目是：代码生成模型的预训练和微调演讲介绍了构建和训练大型代码模型比如: StarCoder 🌟 的幕后过程，还探讨了如何使用开源库，包括 Transformers、da 阅读全文

posted @ 2023-10-23 02:24 HuggingFace 阅读(407) 评论(0) 推荐(0)

不写代码、构建一个开源的 ChatGPT，总共需要几步？｜Hugging News #1020

摘要：每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息，快来看看吧！ 🎉 给 Pro 订阅账户加阅读全文

posted @ 2023-10-23 01:37 HuggingFace 阅读(330) 评论(1) 推荐(0)

面向生产的 LLM 优化

摘要：注意 : 本文同时也是 Transformers 的文档。以 GPT3/4、Falcon 以及 LLama 为代表的大语言模型 (Large Language Model，LLM) 在处理以人为中心的任务上能力突飞猛进，俨然已成为现代知识型行业的重要工具。然而，在实际部署这些模型时，我们仍面临不阅读全文

posted @ 2023-10-19 00:56 HuggingFace 阅读(1793) 评论(0) 推荐(2)

Hugging Face 分词器新增聊天模板属性

摘要：一个幽灵，格式不正确的幽灵，在聊天模型中游荡！太长不看版现存的聊天模型使用的训练数据格式各各不同，我们需要用这些格式将对话转换为单个字符串并传给分词器。如果我们在微调或推理时使用的格式与模型训练时使用的格式不同，通常会导致严重的、无声的性能下降，因此匹配训练期间使用的格式极其重要！ Huggin 阅读全文

posted @ 2023-10-17 23:56 HuggingFace 阅读(1652) 评论(0) 推荐(1)

我们又组织了一次欧洲最大开源社区活动，Hugging Face 博客欢迎社区成员发帖、Hugging Chat 功能更新！

摘要：每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息，快来看看吧！ 🎉 声势浩大的开源 AI 阅读全文

posted @ 2023-10-14 00:40 HuggingFace 阅读(159) 评论(0) 推荐(0)

机器学习即代码的时代已经到来

摘要：译者注: 到底是 AI 会吃掉软件还是软件会吃掉 AI？为了 job security 工程师应该把宝押在哪儿？这篇 2021 年的文章提供的一些视角似乎印证了它现在的流行，有点“运筹于帷幄之中，决胜于数年之后”的意思，颇值得软件架构师和产品经理们内省一番。 2021 版的《人工智能现状报告》于阅读全文

posted @ 2023-10-11 22:02 HuggingFace 阅读(778) 评论(0) 推荐(0)

AudioLDM 2，加速！

摘要：AudioLDM 2 由刘濠赫等人在 AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining 一文中提出。 AudioLDM 2 接受文本提示作为输入并输出对应的音频，其可用于生成逼真的声效、人类阅读全文

posted @ 2023-10-10 16:00 HuggingFace 阅读(486) 评论(0) 推荐(0)

Hugging Face 博客

The AI community building the future.

10 2023 档案

公告