2024 年 8月 30 日随笔档案 - HuggingFace

2024年8月30日

摘要：总结: 随着我们增加内存压缩次数的次数，Infini-attention 的性能会变得越来越差。据我们所知，ring attention、YaRN 和 rope scaling 这三种方法仍是将预训练模型拓展更长上下文的最佳方式。引言: 语言模型的上下文长度也是除模型性能之外的重要属性之一。自 i 阅读全文

posted @ 2024-08-30 15:34 HuggingFace 阅读(84) 评论(0) 推荐(0) 编辑

Docmatix - 超大文档视觉问答数据集

摘要：本文，我们将发布 Docmatix - 一个超大的文档视觉问答 (DocVQA) 数据集，比之前的数据集大 100 倍。当使用 Docmatix 微调 Florence-2 时，消融实验显示 DocVQA 任务的性能提高了 20%。 Docmatix 数据集样本示例缘起于丹鼎 (The Caul 阅读全文

posted @ 2024-08-30 15:20 HuggingFace 阅读(299) 评论(0) 推荐(0) 编辑

基于 Quanto 和 Diffusers 的内存高效 transformer 扩散模型

摘要：过去的几个月，我们目睹了使用基于 transformer 模型作为扩散模型的主干网络来进行高分辨率文生图 (text-to-image，T2I) 的趋势。和一开始的许多扩散模型普遍使用 UNet 架构不同，这些模型使用 transformer 架构作为扩散过程的主模型。由于 transformer 阅读全文

posted @ 2024-08-30 14:28 HuggingFace 阅读(423) 评论(0) 推荐(1) 编辑

公告

Hugging Face 官网

昵称： HuggingFace
园龄： 2年1个月
粉丝： 181
关注： 0

+加关注

2025年2月

日

一

二

三

四

五

六

Hugging Face 博客

The AI community building the future.

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论