随笔- 59 文章- 0 评论- 17 阅读- 18万

当前标签：强化学习

自然语言处理(一) 关系抽取 Vpegasus 2019-03-11 06:36 阅读:29336 评论:1 推荐:2 编辑

论文选读一: Towards end-to-end reinforcement learning of dialogue agents for information access Vpegasus 2018-08-31 10:28 阅读:603 评论:0 推荐:0 编辑

强化学习（九）：策略梯度 Vpegasus 2018-08-13 00:10 阅读:2737 评论:0 推荐:0 编辑

强化学习（八）：Eligibility Trace Vpegasus 2018-08-13 00:09 阅读:1369 评论:0 推荐:0 编辑

强化学习（七）：计划与学习的关系 Vpegasus 2018-08-13 00:06 阅读:1318 评论:0 推荐:0 编辑

强化学习（六）：n-step Bootstrapping Vpegasus 2018-08-13 00:02 阅读:936 评论:0 推荐:0 编辑

强化学习（五）：时间差分学习 Vpegasus 2018-08-12 23:58 阅读:1117 评论:0 推荐:0 编辑

强化学习（四）：蒙特卡洛方法 Vpegasus 2018-08-12 23:56 阅读:826 评论:0 推荐:0 编辑

强化学习（三）：动态规划 Vpegasus 2018-08-12 23:52 阅读:418 评论:0 推荐:0 编辑

强化学习（二）：马尔可夫决策过程 Vpegasus 2018-08-12 23:48 阅读:870 评论:0 推荐:0 编辑

强化学习（一）：引入 Vpegasus 2018-08-12 11:11 阅读:342 评论:0 推荐:0 编辑

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:自然语言处理(一) 关系抽取
谢谢！
--你当像鸟飞往你的Wden
2. Re:时间序列(七): 高冷贵族: 隐马尔可夫模型
博主，有相关预测代码吗？可以分享吗？谢谢
--栀梦者
3. Re:机器学习九机器学习中常用的采样方法
深度好文
--小小欢笑
4. Re:时间序列介绍（一）
请问白噪声那里的协方差和相关系数里的下标 k 是指前文 t 和 s 的差吗
--__斯年
5. Re:时间序列(七): 高冷贵族: 隐马尔可夫模型
博主能不能把自己推导的公式好好改改？前向后向算法那一块跳步骤就算了，你那个j和k能不能分清楚一些？
--pku-coder