随笔档案「2025年2月28日」：NFSP ... - nagimegesa

2025年2月28日

摘要： NSFP算法论文名称：《Deep Reinforcement Learning from Self-Play in Imperfect-Information Games》这是一篇博弈论和强化学习交叉的文章，网上的资料比较少，但是确实是对手建模的重要算法之一。虽然后面的PSRO算法指出NFSP是阅读全文

posted @ 2025-02-28 16:07 nagimegesa 阅读(399) 评论(0) 推荐(0)

这是一篇博客