04 2024 档案

摘要:Q-learning 学习笔记 Q-learning 是一种无模型的强化学习算法,用于学习给定状态下执行某个动作所得到的预期效用。它可以在复杂的环境中寻找最优策略,即在任何给定的状态下选择能获得最高长期回报的动作。下面是一份 Q-learning 的学习笔记,包括基本概念、算法流程和实现步骤。 基本 阅读全文
posted @ 2024-04-24 15:24 Monster_bird 阅读(264) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示