摘要:
title: 如何使用程序生成一个复杂的2D迷宫游戏地图 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: I Solved The World's Hardest Maze (with Co 阅读全文
2024年11月5日
摘要:
title: 对于特定的游戏问题使用启发式算法可以取得比AI算法更好的表现 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: Using A.I. to DOMINATE NERDS in T 阅读全文
摘要:
title: 如何将强化学习问题转换为监督学习问题 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: A.I. teaches itself to drive in Trackmania 如何 阅读全文
摘要:
title: 强化学习训练过程中的过度拟合(overfitting) description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: A.I. Learns to Drive From Scratch in 阅读全文
摘要:
title: 如何使用强化学习算法解决贪吃蛇问题(Neural Network Learns to Play Snake) description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: Neural Ne 阅读全文
摘要:
title: 应不应该研发垂直起降战斗机 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 虽然我是搞machine learning research的,但是由于比较水,而且平时也比较水,所以喜欢看 阅读全文
摘要:
title: 强化学习算法中基于值的和基于策略梯度的两类算法到底哪个速度更快 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 有人说基于值的RL算法收敛速度快,有人说基于策略梯度的RL算法收敛快,而 阅读全文
摘要:
title: 强化学习问题中适当的增加反应时长可能会更有利于训练 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 强化学习问题中适当的增加反应时长可能会更有利于训练。 看到一个视频 I Trappe 阅读全文
2024年11月3日
摘要:
title: g++ error unrecognized command-line option ‘-std=c++23’; did you mean ‘-std=c++03’? description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或 阅读全文
摘要:
title: 强化学习算法——TPG算法(遗传编程GP算法)代码 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 tpg算法是一个使用模块涌现和复用机制的遗传编程(GP)算法,该算法在一些强化学习问 阅读全文