AI 强化学习

强化学习(reinforcement learning,简称RL),

 

agent

policy

 

state

action

 

 

 

 

目标 

最大化累计reward

 

参考链接:

https://en.wikipedia.org/wiki/Reinforcement_learning

https://drive.google.com/file/d/1opPSz5AZ_kVa1uWOdOiveNiBFiEOHjkG/view 

 

posted @ 2019-04-08 23:27  happyyoung  阅读(375)  评论(0编辑  收藏  举报