可用的摘要模型

当前最流行的先进模型

huggingface社区

image

paperswithcode

image
image

大部分模型都是基于以下表中模型,做了数据集或其他部分的微小变动。
在近几年各种论文的对比实验中,基本对照的模型都是以下模型:

模型 描述 能否训练
BART 通用模型,适合做摘要任务 不能预训练,可以微调
PEGASUS 针对摘要任务 不能预训练,勉强微调?
T5 通用模型,适合做摘要任务 大模型,做摘要任务不能微调
BigBird 通用模型,稀疏注意力 可以预训练

BigBird √

image

Pegasus ⚪

image
image

image

image

BART -微调

image

BART微调

T5-微调

微调
simpleT5

FactorSUM

image

posted @   ︶ㄣ演戲ㄣ  阅读(57)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
点击右上角即可分享
微信分享提示