Loading [MathJax]/extensions/TeX/extpfeil.js

动态RNN和静态RNN区别

调用static_rnn实际上是生成了rnn按时间序列展开之后的图。打开tensorboard你会看到sequence_length个rnn_cell stack在一起，只不过这些cell是share weight的。因此，sequence_length就和图的拓扑结构绑定在了一起，因此也就限制了每个batch的sequence_length必须是一致。

调用dynamic_rnn不会将rnn展开，而是利用tf.while_loop这个api，通过Enter, Switch, Merge, LoopCondition, NextIteration等这些control flow的节点，生成一个可以执行循环的图（这个图应该还是静态图，因为图的拓扑结构在执行时是不会变化的）。在tensorboard上，你只会看到一个rnn_cell, 外面被一群control flow节点包围着。对于dynamic_rnn来说，sequence_length仅仅代表着循环的次数，而和图本身的拓扑没有关系，所以每个batch可以有不同sequence_length。

链接：https://www.zhihu.com/question/52200883/answer/251068217

posted @ 2019-01-09 16:14 simple_wxl 阅读(2204) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· Linux glibc自带哈希表的用例及性能测试
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统？
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 现代计算机视觉入门之：什么是图片特征编码

阅读排行：
· 手把手教你在本地部署DeepSeek R1，搭建web-ui ，建议收藏！
· Spring AI + Ollama 实现 deepseek-r1 的API服务和调用
· 数据库服务器 SQL Server 版本升级公告
· C#/.NET/.NET Core技术前沿周刊 | 第 23 期（2025年1.20-1.26）
· 程序员常用高效实用工具推荐，办公效率提升利器！

公告

昵称： simple_wxl
园龄： 8年7个月
粉丝： 55
关注： 0

<

2025年1月

>

日

一

二

三

四

五

六

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:中文多分类 BERT
你好，最近也是bert多分类，计算指标时出错，我这分类比较多，有一百个左右，所以不知道如何计算它的指标，能请教下吗，感谢（F1，recall等指标计算）
--张青1111
2. Re:各种排序算法的时间复杂度和空间复杂度
快排的空间复杂度，我查的为什么是O(logn)呢？
--maomao_dreamhigh
3. Re:LambdaRank
露珠，你有github吗，之前的找不到了
--yishanjin
4. Re:欢迎follow github:https://github.com/wuxiangli91
git地址找不到了
--yishanjin
5. Re:tf.sequence_mask
想请教下：
1. 如果输入的序列是定长的，是否还需要定义mask?
2. 这个seq2seq模型训练完毕，其输出长度是如何指定的？是固定的还是可以后期人为再来指定呢？？
--老笨啊