强化学习如何自定义环境?【写代码的时候如何与标准接轨】

还是需要学习如何自定义一个可以交互的环境,走上标准的道路,才能调用很多东西。

摸清楚套路,然后一步一步跟着实现。Just get close to your aim!

这次的环境搭建主要模仿参考链接1,

前言

稍微看了一下,只要定义好自己的名字,有对应的函数实现,自己在gym库里边的__init__.py中注册就可以调用了。
【希望实际操作起来和我想的差不多】

注册了的环境,可以通过向gym的通用接口写入环境名创建。除了环境名和接口两个基本信息外,奖励阈值和最大步长则是与训练相关的参数,还可以自行添加其他参数。

浅放个截图

实践

不得不说,真的很久没有跟着教程就能完成的代码了。经验证,代码可用。真是皆大欢喜啊!
给了迷茫的我一点动力。
大家直接看参考链接就可以啦!

一些碎碎念

大道至简,所有的套路都是一样的。标准的都是合乎你想的逻辑的,看的多了自然就会了。
不论是代码还是文章,条理性都是必不可少的,要养成良好的读写习惯。

参考链接

  1. 【强化学习实战:自定义Gym环境】https://www.cnblogs.com/wsy950409/p/15645049.html
posted @ 2022-12-06 17:32  芋圆院长  阅读(355)  评论(0编辑  收藏  举报