一切根据和符合于客观事实的思想是正确的思想
一切根据于正
|

伊犁纯流莱

园龄:3年4个月粉丝:2关注:1

用于决策的世界模型 -- 论文 World Models (2018) & PlaNet (2019) 讲解
摘要: 介绍了两篇世界模型的文章 World Models (2018) 和 Learning Latent Dynamics for Planning from Pixels (2019),主要侧重点是世界模型在决策和规划中的应用。
285
0
3
策略梯度AC算法 - CartPole环境, 使用RNN作为策略网络
摘要: 本文给出了使用RNN作为策略网络的AC算法代码示例,并在CartPole环境跑出结果。
16
0
0
变分推断(VI)、随机梯度变分推断(SGVI/SGVB)、变分自编码器(VAE)串讲
摘要: 变分推断(VI)、随机梯度变分推断(SGVI/SGVB)、变分自编码器(VAE)串讲 主要介绍了变分推断(VI)、随机梯度变分推断(SGVI/SGVB)、变分自编码器(VAE)
274
0
0
RL中on-policy和off-policy的本质区别/重要性采样
摘要: 讨论了on-policy和off-policy的本质区别。说明了off-policy MC和off-policy TD是如何利用重要性采样的,以及为什么Q-learning不需要进行重要性采样。
53
0
0
概率图模型&机器学习 -- 精确推断方法 -- 变量消去(Variable Elimination)和信念传播(Belief Propagation)
摘要: 概率图模型&机器学习 -- 精确推断方法 -- 变量消去(Variable Elimination)和信念传播(Belief Propagation) 介绍变量消去和信念传播两种精确推断方法,其中信念传播中又分别介绍了sum-product和max-product.
195
0
0
   
点击右上角即可分享
微信分享提示
深色
回顶
收起