呦呦南山 - 博客园

2021年12月31日

摘要：使用 $ pip install git+https://github.com/takuseno/d4rl-atari安装时经常报错。可通过先下载到本地，再上传到服务器，最后再pip install . 安装即可阅读全文

posted @ 2021-12-31 17:31 呦呦南山阅读(158) 评论(0) 推荐(0) 编辑

ROM is missing for pong, see https://github.com/openai/atari-py#roms for instructions

摘要： pip uninstall atari-pypip install atari-py==0.2.5 阅读全文

posted @ 2021-12-31 11:03 呦呦南山阅读(262) 评论(0) 推荐(0) 编辑

tensorflow.python.framework.errors_impl.NotFoundError: /tmp/dataset/Pong/run_1-00000-of-00001; No such file or directory [Op:IteratorGetNext]

摘要：这个问题是在tensorflow中经常遇到的问题，解决的方法是：直接使用绝对路径，而不是相对路径： python atari_example.py --path=/home/longfei-fwxz/code_and_test/ppo_atari/tmp/dataset --game=Pong 注意阅读全文

posted @ 2021-12-31 11:01 呦呦南山阅读(885) 评论(0) 推荐(0) 编辑

2021年12月30日

rl_unplugged 中的reverb issue

摘要：在rl_unplugged安装中，不能直接pip install reverb, 而是应该安装pip install dm-reverb 阅读全文

posted @ 2021-12-30 21:15 呦呦南山阅读(40) 评论(0) 推荐(0) 编辑

2021年12月27日

安装tmarl

摘要：在tmarl_master（这个是master，在其他的branch下也是可以的），使用命令pip install -e . 即可安装成功。阅读全文

posted @ 2021-12-27 17:00 呦呦南山阅读(30) 评论(0) 推荐(0) 编辑

2021年12月9日

获取discrete()类型中的数字

摘要： self.action_space.n即可阅读全文

posted @ 2021-12-09 12:05 呦呦南山阅读(21) 评论(0) 推荐(0) 编辑

2021年12月6日

安装oh my zsh，调整.zshrc

摘要： 1.可以搜索oh my zsh官网进行安装 2.可以从其他节点拷贝.oh_my_zsh的安装包，直接复制到目的节点下即可 3.同理可复制其他节点的.zshrc到目的节点下即可阅读全文

posted @ 2021-12-06 20:20 呦呦南山阅读(212) 评论(0) 推荐(0) 编辑

神经网络更新覆盖的问题

摘要：同一个神经网络不同的输入，同时计算后得到输出，如果同时对这两个网络的输出的loss进行更新，则会使得网络参数被覆盖，网络参数并不会更新两次，而是更新1次。比如，上面更新，values_1的更新会覆盖掉values_2的更新。阅读全文

posted @ 2021-12-06 12:27 呦呦南山阅读(78) 评论(0) 推荐(0) 编辑

2021年12月1日

mappo中的多个agent的done的统计

摘要： eval_masks[eval_dones == True] = np.zeros( ((eval_dones == True).sum(), 1), dtype=np.float32)eval_rnn_states[eval_dones == True] = np.zeros( ((eval_do 阅读全文

posted @ 2021-12-01 19:23 呦呦南山阅读(125) 评论(0) 推荐(0) 编辑

torch.max() 梯度回传问题

摘要：对于2个网络生成的loss，经过torch.max操作后形成一个loss，此时进行loss.backward则对应的是取max的网络的梯度更新。阅读全文

posted @ 2021-12-01 16:55 呦呦南山阅读(1082) 评论(0) 推荐(0) 编辑

公告