T5大型语言模型
T5 and Large Language Model
T5
Text-to-Text Transfer Transformer.
see all NLP questions as A TEXT-TO-TEXT TASK
universal format: task description + sentence -> answer
Details
Pretrain: BERT-base-sized encoder-decoder transformer, denoising objective, C4 datasets
finetune: GLUE CNN abstract SQuAD
mT5
multilingual T5
Clozed Domain QA
T5.1.1 only pretrained on unsupervised data to get knowledge.
use salient span masking to mask entities
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律