MATLAB代码:安全 强化学习

关键词:safe RL

仿真平台:MATLAB

主要内容:此代码展示了如何使用 Constraint Enforcement 块来训练强化学习 (RL) 代理。

此块计算最接近受约束和动作边界的代理输出的动作的修改控制动作。

训练强化学习代理需要 Reinforcement Learning Toolbox 。

在此示例中,代理的目标是使绿球尽可能靠近红球不断变化的目标位置。

具体步骤为创建用于收集数据的环境和代理,学习约束函数,使用约束强制训练代理,在没有约束执行的情况下训练代理。

ID:25100682638870022

posted on   gongyic  阅读(53)  评论(0编辑  收藏  举报
(评论功能已被禁用)
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律



点击右上角即可分享
微信分享提示