摘要:
策略梯度(Policy Gradient) 在一个包含Actor、Env、Reward Function的强化学习的情景中,Env和... 阅读全文
摘要:
马尔科夫决策过程(Markov Decision Process) 马尔科夫决策过程(Markov Decision Process... 阅读全文
摘要:
参考 Deep Learning 英文原版深度学习中文版 阅读全文
摘要:
Bagging(装袋法),bootstrap aggregating(自举汇聚法) 的简称,是一个通过组合多个模型来减少泛化误差... 阅读全文
摘要:
universal approximation theorem 万能近似定理(universal approximation the... 阅读全文
摘要:
如果概括性地回答这个问题,我们其实是希望得到最大似然(maximum likelihood),使得模型的预测分布与数据的实际分布尽可... 阅读全文
摘要:
内容总结自花书《deep learning》Chapter5,由英文版翻译而来,英文版可以在其官网免费查阅。同时博主也发明中文翻... 阅读全文
摘要:
内容总结自花书《deep learning》Chapter5,由英文版翻译而来,英文版可以在其官网免费查阅。同时博主也发明中文翻... 阅读全文
摘要:
内容总结自自花书《deep learning》Chapter 5,由英文版翻译而来。英文版官网可以免费查阅:http://www... 阅读全文
摘要:
内容总结自自花书《deep learning》Chapter 5.5,由英文版翻译而来。英文版官网可以免费查阅:http://w... 阅读全文