会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
十点三十睡觉
博客园
首页
新随笔
联系
订阅
管理
2022年4月25日
transformer 论文讲解
摘要: 序列转录模型:给一个序列生成另外一个序列 本文仅仅使用了注意力集中机制没有用循环或者卷积 RNN缺点:1)无法并行 2)起初的隐藏信息可能会被丢掉,内存需要很大 起初attention用于将encoder的信息更好的传给decoder encoder是想输入转变为一系列的向量,将x1-xn变为z1-
阅读全文
posted @ 2022-04-25 09:36 十点三十睡觉
阅读(331)
评论(0)
推荐(0)
编辑
公告