摘要: Q-Learning算法 理论 Q-Learning是一种强化学习算法,用于学习在给定状态下采取不同行动的最佳策略。其公式如下: $Q(s,a) \leftarrow (1 - \alpha) \cdot Q(s,a) + \alpha \cdot (r + \gamma \cdot \max_{a 阅读全文
posted @ 2023-03-15 16:17 Please Call me 小强 阅读(486) 评论(0) 推荐(0) 编辑