摘要:
一、使用torch.nn中组装方法 注意,当你初始化好自己的module后,pytorch会默认自动初始化module里面的网络参数的 1.nn.Sequential组装net import torch from torch import nn net = nn.Sequential( nn.Lin 阅读全文
摘要:
一、强化学习的主要构成 强化学习主要由两部分组成:智能体(agent)和环境(env)。在强化学习过程中,智能体与环境一直在交互。智能体在环境里面获取某个状态后,它会利用该状态输出一个动作(action)。然后这个动作会在环境之中被执行,环境会根据智能体采取的动作,输出下一个状态以及当前这个动作带来 阅读全文