摘要: 一、使用torch.nn中组装方法 注意,当你初始化好自己的module后,pytorch会默认自动初始化module里面的网络参数的 1.nn.Sequential组装net import torch from torch import nn net = nn.Sequential( nn.Lin 阅读全文
posted @ 2023-04-22 21:50 Bai_Er 阅读(108) 评论(0) 推荐(0) 编辑
摘要: 一、强化学习的主要构成 强化学习主要由两部分组成:智能体(agent)和环境(env)。在强化学习过程中,智能体与环境一直在交互。智能体在环境里面获取某个状态后,它会利用该状态输出一个动作(action)。然后这个动作会在环境之中被执行,环境会根据智能体采取的动作,输出下一个状态以及当前这个动作带来 阅读全文
posted @ 2023-04-13 23:00 Bai_Er 阅读(831) 评论(0) 推荐(0) 编辑