上一页 1 ··· 8 9 10 11 12 13 14 15 16 下一页
摘要: 使用 $ pip install git+https://github.com/takuseno/d4rl-atari安装时经常报错。可通过先下载到本地,再上传到服务器,最后再pip install . 安装即可 阅读全文
posted @ 2021-12-31 17:31 呦呦南山 阅读(158) 评论(0) 推荐(0) 编辑
摘要: pip uninstall atari-pypip install atari-py==0.2.5 阅读全文
posted @ 2021-12-31 11:03 呦呦南山 阅读(262) 评论(0) 推荐(0) 编辑
摘要: 这个问题是在tensorflow中经常遇到的问题,解决的方法是:直接使用绝对路径,而不是相对路径: python atari_example.py --path=/home/longfei-fwxz/code_and_test/ppo_atari/tmp/dataset --game=Pong 注意 阅读全文
posted @ 2021-12-31 11:01 呦呦南山 阅读(885) 评论(0) 推荐(0) 编辑
摘要: 在rl_unplugged安装中,不能直接pip install reverb, 而是应该安装pip install dm-reverb 阅读全文
posted @ 2021-12-30 21:15 呦呦南山 阅读(40) 评论(0) 推荐(0) 编辑
摘要: 在tmarl_master(这个是master,在其他的branch下也是可以的),使用命令pip install -e . 即可安装成功。 阅读全文
posted @ 2021-12-27 17:00 呦呦南山 阅读(30) 评论(0) 推荐(0) 编辑
摘要: self.action_space.n即可 阅读全文
posted @ 2021-12-09 12:05 呦呦南山 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 1.可以搜索oh my zsh官网进行安装 2.可以从其他节点拷贝.oh_my_zsh的安装包,直接复制到目的节点下即可 3.同理可复制其他节点的.zshrc到目的节点下即可 阅读全文
posted @ 2021-12-06 20:20 呦呦南山 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 同一个神经网络不同的输入,同时计算后得到输出,如果同时对这两个网络的输出的loss进行更新,则会使得网络参数被覆盖,网络参数并不会更新两次,而是更新1次。 比如,上面更新,values_1的更新会覆盖掉values_2的更新。 阅读全文
posted @ 2021-12-06 12:27 呦呦南山 阅读(78) 评论(0) 推荐(0) 编辑
摘要: eval_masks[eval_dones == True] = np.zeros( ((eval_dones == True).sum(), 1), dtype=np.float32)eval_rnn_states[eval_dones == True] = np.zeros( ((eval_do 阅读全文
posted @ 2021-12-01 19:23 呦呦南山 阅读(125) 评论(0) 推荐(0) 编辑
摘要: 对于2个网络生成的loss,经过torch.max操作后形成一个loss,此时进行loss.backward则对应的是取max的网络的梯度更新。 阅读全文
posted @ 2021-12-01 16:55 呦呦南山 阅读(1082) 评论(0) 推荐(0) 编辑
上一页 1 ··· 8 9 10 11 12 13 14 15 16 下一页