2022 年 1月 24 日随笔档案 - deephub

2022年1月24日

摘要：这是一个我已经断断续续地研究了很长一段时间的项目。在此项目之前我从未尝试过修改游戏，也从未成功训练过“真正的”强化学习代理（智能体）。所以这个项目挑战是：解决钓鱼这个问题的“状态空间”是什么。当使用一些简单的 RL 框架进行编码时，框架本身可以为我们提供代理、环境和奖励，我们不必考虑问题的建模部分。阅读全文

posted @ 2022-01-24 11:36 deephub 阅读(312) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

公告