从流域到海域

摘要：策略梯度(Policy Gradient) 在一个包含Actor、Env、Reward Function的强化学习的情景中，Env和... 阅读全文

posted @ 2019-08-26 16:53 从流域到海域阅读(189) 评论(0) 推荐(0) 编辑

摘要：马尔科夫决策过程(Markov Decision Process) 马尔科夫决策过程(Markov Decision Process... 阅读全文

posted @ 2019-07-17 17:00 从流域到海域阅读(490) 评论(0) 推荐(0) 编辑

摘要：参考 Deep Learning 英文原版深度学习中文版阅读全文

posted @ 2019-07-03 15:56 从流域到海域阅读(77) 评论(0) 推荐(0) 编辑

摘要： Bagging(装袋法)，bootstrap aggregating(自举汇聚法) 的简称，是一个通过组合多个模型来减少泛化误差... 阅读全文

posted @ 2019-06-15 14:14 从流域到海域阅读(607) 评论(0) 推荐(0) 编辑

摘要： universal approximation theorem 万能近似定理(universal approximation the... 阅读全文

posted @ 2019-06-10 19:46 从流域到海域阅读(473) 评论(0) 推荐(0) 编辑

摘要：如果概括性地回答这个问题，我们其实是希望得到最大似然(maximum likelihood)，使得模型的预测分布与数据的实际分布尽可... 阅读全文

posted @ 2019-06-08 15:47 从流域到海域阅读(386) 评论(0) 推荐(0) 编辑

摘要：内容总结自花书《deep learning》Chapter5，由英文版翻译而来，英文版可以在其官网免费查阅。同时博主也发明中文翻... 阅读全文

posted @ 2019-06-02 17:14 从流域到海域阅读(96) 评论(0) 推荐(0) 编辑

摘要：内容总结自花书《deep learning》Chapter5，由英文版翻译而来，英文版可以在其官网免费查阅。同时博主也发明中文翻... 阅读全文

posted @ 2019-06-02 16:58 从流域到海域阅读(141) 评论(0) 推荐(0) 编辑

摘要：内容总结自自花书《deep learning》Chapter 5，由英文版翻译而来。英文版官网可以免费查阅：http://www... 阅读全文

posted @ 2019-06-02 14:54 从流域到海域阅读(248) 评论(0) 推荐(0) 编辑

摘要：内容总结自自花书《deep learning》Chapter 5.5，由英文版翻译而来。英文版官网可以免费查阅：http://w... 阅读全文

posted @ 2019-06-01 16:22 从流域到海域阅读(869) 评论(0) 推荐(0) 编辑