Playing FPS Games with Deep Reinforcement Learning

论文不同点：

（1）用两套网络分别实现移动和射击。

（2）使用LSTM来处理不完全信息。

疑问：

（1）为什么对于射击使用RNN，对导航却没有使用RNN。一般来说，当我们看见视野里面有敌人的时候，我们可以立即进行射击，似乎不太需要长久的历史信息，再官方给出的视频中，我也没发现RNN有什么好处。另一方面，倒是导航应该使用RNN，对于非完全信息来说，bot只根据当前的画面并不能判断自身的位置和已经走过的路径，加入历史信息才能帮助bot建立长久的移动策略。

该论文没有考虑的地方：

（1）没有环顾四周探测敌人和物资的策略。

（2）没有训练上下视角移动的策略，没法精确射击敌人，没法处理有阶梯的情况。

posted @ 2018-02-26 14:53 Shiyu_Huang 阅读(530) 评论(0) 编辑收藏举报

刷新页面返回顶部

黄世宇@智谱AI，OpenRL Lab负责人，强化学习，LLM，通用人工智能[OpenRL][知乎][GitHub][Linkedin]如果你对人工智能前沿感兴趣，欢迎联系并加入我们！

Playing FPS Games with Deep Reinforcement Learning

黄世宇@智谱AI，OpenRL Lab负责人，强化学习，LLM，通用人工智能
[OpenRL][知乎][GitHub][Linkedin]
如果你对人工智能前沿感兴趣，欢迎联系并加入我们！