【人工智能导论:模型与算法】贝尔曼方程 奖励函数 R(s1,a,s2)的简写,应该是Rs1还是Rs2 ?

不同的书写的不大一样。

看的时候有点晕,原来是没有统一标准 ~

写成: R(s1,a,s2)是没有争议的~

 

 

 

posted on 2022-01-23 23:48  HBU_DAVID  阅读(153)  评论(3编辑  收藏  举报

导航