《机器学习十讲》第十讲 强化学习

一、马尔可夫决策过程MDP

 

 

二、基于价值的方法 

Q-Learning

DQN

三、基于策略的方法

策略梯度算法

四、总结

机器学习——》微积分 、概率论、优化方法、统计学

              ——》python、数据结构、数据库

数据采集、数据管理、数据清洗、数据可视化

深度学习、强化学习

NLP、网络分析。。。。。

与相应行业结合

 

 学习建议

posted on 2021-02-05 19:28  嘻嘻_嘻  阅读(58)  评论(0编辑  收藏  举报