2024 年 3月 14 日随笔档案 - deephub

2024年3月14日

摘要：处理单一任务是强化学习的基础，它的目标是在不确定的环境中采取最佳行动，产生相对于任务的最大长期回报。但是在多代理强化学习中，因为存在多个代理，所以代理之间的关系可以是合作的，也可以是对抗，或者两者的混合。多代理的强化学习引入了更多的复杂性，每个代理的状态不仅包括对自身的观察，还包括对其他代理位置及其阅读全文

posted @ 2024-03-14 11:33 deephub 阅读(103) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

公告