会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
快乐的拉格朗日
博客园
首页
新随笔
联系
订阅
管理
随笔 - 9
文章 - 0
评论 - 0
阅读 -
3232
04 2023 档案
Attention Is All You Need—transformer详解
摘要:Attention Is All You Need 论文 transformer代码 以下大部分是根据论文理解进行的总结和概括,如有疑问,欢迎交流~ transformer仅仅使用注意力机制,没有使用任何的卷积或者RNN结构。 传统RNN结构的当前隐层状态
h
t
需要当前时刻的输入以及上一时刻的隐
阅读全文
posted @
2023-04-29 09:47
快乐的拉格朗日
阅读(60)
评论(0)
推荐(0)
编辑
公告
昵称:
快乐的拉格朗日
园龄:
5年
粉丝:
2
关注:
0
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
深度学习
(4)
audio
(2)
网络服务
(2)
数据处理
(1)
随笔分类
时序深度学习网络(4)
数据处理(1)
网络服务(2)
音频处理(1)
随笔档案
2023年10月(1)
2023年4月(1)
2023年1月(6)
2022年11月(1)
阅读排行榜
1. LSTM原理专项介绍(626)
2. tornado原理介绍及异步非阻塞实现方式(614)
3. 初探attention—attention原理和代码详解(540)
4. ECAPA-TDNN结合代码的理解(482)
5. RNN原理介绍(338)
推荐排行榜
1. LSTM原理专项介绍(1)
2. tornado原理介绍及异步非阻塞实现方式(1)
点击右上角即可分享