MATLAB代码:安全 强化学习
关键词:safe RL
仿真平台:MATLAB
主要内容:此代码展示了如何使用 Constraint Enforcement 块来训练强化学习 (RL) 代理。
此块计算最接近受约束和动作边界的代理输出的动作的修改控制动作。
训练强化学习代理需要 Reinforcement Learning Toolbox 。
在此示例中,代理的目标是使绿球尽可能靠近红球不断变化的目标位置。
具体步骤为创建用于收集数据的环境和代理,学习约束函数,使用约束强制训练代理,在没有约束执行的情况下训练代理。
ID:25100682638870022