2019 年 1月 14 日随笔档案 - 乐乐章

2019年1月14日

摘要：问题： https://www.programcreek.com/python/example/90420/tensorflow.map_fn https://stackoverflow.com/questions/34987509/tensorflow-max-of-a-tensor-along- 阅读全文

posted @ 2019-01-14 21:36 乐乐章阅读(609) 评论(0) 推荐(0) 编辑

愤怒的小鸟强化学习

摘要： https://github.com/yenchenlin/DeepLearningFlappyBird https://pypi.org/project/gym-tetris/ https://github.com/openai/gym/wiki/Leaderboard#breakout-v0 h 阅读全文

posted @ 2019-01-14 15:48 乐乐章阅读(841) 评论(1) 推荐(0) 编辑

强化学习--DeepQnetwork 的一些改进

摘要： Double DQN 算Q值与选Q值是分开的，2个网络。 Multi-step Dueling DQN 如果更新了，即使有的action没有被采样到，也会更新Q值 Prioritized Reply Noisy Net Epsilon Greedy 存在的问题是在一局游戏中，即使是同一个agen 阅读全文

posted @ 2019-01-14 15:10 乐乐章阅读(528) 评论(0) 推荐(0) 编辑

乐乐章

NLP/推荐我很菜

公告

乐乐章

NLP/推荐 我很菜

公告

NLP/推荐我很菜