摘要: 问题: https://www.programcreek.com/python/example/90420/tensorflow.map_fn https://stackoverflow.com/questions/34987509/tensorflow-max-of-a-tensor-along- 阅读全文
posted @ 2019-01-14 21:36 乐乐章 阅读(608) 评论(0) 推荐(0) 编辑
摘要: https://github.com/yenchenlin/DeepLearningFlappyBird https://pypi.org/project/gym-tetris/ https://github.com/openai/gym/wiki/Leaderboard#breakout-v0 h 阅读全文
posted @ 2019-01-14 15:48 乐乐章 阅读(838) 评论(1) 推荐(0) 编辑
摘要: Double DQN 算Q值 与选Q值是分开的,2个网络。 Multi-step Dueling DQN 如果更新了,即使有的action没有被采样到,也会更新Q值 Prioritized Reply Noisy Net Epsilon Greedy 存在的问题是在一局游戏中, 即使是同一个agen 阅读全文
posted @ 2019-01-14 15:10 乐乐章 阅读(522) 评论(0) 推荐(0) 编辑