会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
cauwj
博客园
首页
新随笔
联系
订阅
管理
随笔 - 76
文章 - 0
评论 - 1
阅读 -
29522
2024年7月20日
Datawhale Al夏令营——Transformer架构
摘要: Transformer:这个模型架构就是摒弃了所有的循环结构,完全依赖于注意力机制对源语言序列和目标语言序列全局依赖的建模 对于循环神经网络来说,上下文的语义依赖是通过维护循环单元中的隐状态实现的。在编码过程中,每一个时间步的输入建模都涉及到对隐藏状态的修改。随着序列长度的增加,编码在隐藏状态中的序
阅读全文
posted @ 2024-07-20 17:44 CASTWJ
阅读(53)
评论(0)
推荐(0)
编辑
公告
昵称:
CASTWJ
园龄:
3年3个月
粉丝:
11
关注:
1
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
随笔分类
365天深度学习(38)
Datawhale AI夏令营(6)
Datawhale——PyTorch图像分类实战(3)
Datawhale学习——深入浅出PyTorch(6)
DeepLearning in Biosequences(2)
linux学习记录(2)
NLP学习进阶(3)
李宏毅机器学习笔记(2)
生信入门(5)
屠鸭(7)
随笔档案
2024年8月(1)
2024年7月(5)
2024年4月(5)
2023年10月(2)
2023年9月(2)
2023年8月(2)
2023年7月(4)
2023年6月(3)
2023年5月(5)
2023年4月(4)
2023年3月(4)
2023年2月(3)
2023年1月(11)
2022年12月(6)
2022年11月(4)
2022年10月(8)
2022年9月(7)
阅读排行榜
1. 雅思写作笔记——杜仕明(3236)
2. 雅思听力笔记——何琼(3080)
3. 雅思写作笔记——Simon Task1(2087)
4. 雅思口语笔记——杨帅(2075)
5. WGBS上游分析(1282)
评论排行榜
1. 第五章:PyTorch模型定义(1)
推荐排行榜
1. 雅思听力笔记——何琼(1)
2. 第五章:PyTorch模型定义(1)
最新评论
1. Re:第五章:PyTorch模型定义
之后我们把model对应的layer名称打印出来看一下,可以观察到差别在于多卡并行的模型每层的名称前多了一个“module”。
请问是怎么打印的呢?
--zz子木zz
点击右上角即可分享