Python代码:电池储能 深度强化学习
关键词:BMS DRL
仿真平台:Python Pytorch
主要内容:电池,PV,动态负载,通过PCC连接到主电网。
我们需要控制电池充电/放电计划以降低成本。
DRL用于训练代理。
它是一种简单的无模型、基于策略的深度强化学习(DRL)方法。
策略被表示为行动的概率分布,这使得它非常类似于分类问题,类的数量等于我们可以执行的行动的数量。
Agent将观察值从传递到NN,获得动作的概率分布,并使用概率分布执行随机抽样,以获得要执行的动作。
这在开始时是随机的,但在训练后会有所改善。
ID:21100682346905349