2022年1月23日

【人工智能导论:模型与算法】贝尔曼方程 奖励函数 R(s1,a,s2)的简写,应该是Rs1还是Rs2 ?

摘要: 不同的书写的不大一样。 看的时候有点晕,原来是没有统一标准 ~ 写成: R(s1,a,s2)是没有争议的~ 阅读全文

posted @ 2022-01-23 23:48 HBU_DAVID 阅读(153) 评论(3) 推荐(0) 编辑

导航