会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
RedNoseBo
博客园
首页
新随笔
联系
管理
订阅
2023年10月30日
Transoformer Pytorch实现
摘要: Transofrmer翻译任务的工作流程 注意力Pad掩码的获得 因为输入句子需要统一长度,肯定会填充Pad特殊字符,Pad特殊字符在word embedding中的数值为0。 提前生成好注意力机制中Pad的掩码。 假设句子长度为Len,那就生成一个Len x Len 矩阵,将其Pad位置,也就是输
阅读全文
posted @ 2023-10-30 15:33 Laplace蒜子
阅读(62)
评论(0)
推荐(0)
编辑
公告