12 2021 档案
摘要:使用 $ pip install git+https://github.com/takuseno/d4rl-atari安装时经常报错。可通过先下载到本地,再上传到服务器,最后再pip install . 安装即可
阅读全文
摘要:pip uninstall atari-pypip install atari-py==0.2.5
阅读全文
摘要:这个问题是在tensorflow中经常遇到的问题,解决的方法是:直接使用绝对路径,而不是相对路径: python atari_example.py --path=/home/longfei-fwxz/code_and_test/ppo_atari/tmp/dataset --game=Pong 注意
阅读全文
摘要:在rl_unplugged安装中,不能直接pip install reverb, 而是应该安装pip install dm-reverb
阅读全文
摘要:在tmarl_master(这个是master,在其他的branch下也是可以的),使用命令pip install -e . 即可安装成功。
阅读全文
摘要:self.action_space.n即可
阅读全文
摘要:1.可以搜索oh my zsh官网进行安装 2.可以从其他节点拷贝.oh_my_zsh的安装包,直接复制到目的节点下即可 3.同理可复制其他节点的.zshrc到目的节点下即可
阅读全文
摘要:同一个神经网络不同的输入,同时计算后得到输出,如果同时对这两个网络的输出的loss进行更新,则会使得网络参数被覆盖,网络参数并不会更新两次,而是更新1次。 比如,上面更新,values_1的更新会覆盖掉values_2的更新。
阅读全文
摘要:eval_masks[eval_dones == True] = np.zeros( ((eval_dones == True).sum(), 1), dtype=np.float32)eval_rnn_states[eval_dones == True] = np.zeros( ((eval_do
阅读全文
摘要:对于2个网络生成的loss,经过torch.max操作后形成一个loss,此时进行loss.backward则对应的是取max的网络的梯度更新。
阅读全文