Python代码:电池储能 深度强化学习

关键词:BMS DRL

仿真平台:Python Pytorch

主要内容:电池,PV,动态负载,通过PCC连接到主电网。

我们需要控制电池充电/放电计划以降低成本。

DRL用于训练代理。

它是一种简单的无模型、基于策略的深度强化学习(DRL)方法。

策略被表示为行动的概率分布,这使得它非常类似于分类问题,类的数量等于我们可以执行的行动的数量。

Agent将观察值从传递到NN,获得动作的概率分布,并使用概率分布执行随机抽样,以获得要执行的动作。

这在开始时是随机的,但在训练后会有所改善。

ID:21100682346905349

posted on 2023-05-14 16:34  maylue2  阅读(112)  评论(0编辑  收藏  举报