摘要: NSFP算法 论文名称:《Deep Reinforcement Learning from Self-Play in Imperfect-Information Games》 这是一篇博弈论和强化学习交叉的文章,网上的资料比较少,但是确实是对手建模的重要算法之一。虽然后面的PSRO算法指出NFSP是 阅读全文
posted @ 2025-02-28 16:07 nagimegesa 阅读(399) 评论(0) 推荐(0)