2023 年 3月 15 日随笔档案 - Please Call me 小强

2023年3月15日

摘要： Q-Learning算法理论 Q-Learning是一种强化学习算法，用于学习在给定状态下采取不同行动的最佳策略。其公式如下： $Q(s,a) \leftarrow (1 - \alpha) \cdot Q(s,a) + \alpha \cdot (r + \gamma \cdot \max_{a 阅读全文

posted @ 2023-03-15 16:17 Please Call me 小强阅读(486) 评论(0) 推荐(0) 编辑

Please Call me 小强

记录的过程也是学习的过程，也是方便自己方便他人的过程

公告