会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
jasonzhangxianrong
博客园
首页
新随笔
联系
订阅
管理
2024年6月16日
(十三)T5是如何计算损失的
摘要: 一、概述 T5 使用常规交叉熵损失(与任何语言模型一样)。 假设您正在微调 T5 以进行翻译,并且您有以下训练示例: * source sentence: "hello how are you" * target sentence: "salut comment ça-va" 首先,需要使用 对模型
阅读全文
posted @ 2024-06-16 21:41 jasonzhangxianrong
阅读(62)
评论(0)
推荐(0)
编辑
公告