gym强化学习入门demo——随机选取动作 其实有了这些动作和反馈值以后就可以用来训练DNN网络了
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 | # -*- coding: utf-8 -*- import gym import time env = gym.make( 'CartPole-v0' ) observation = env.reset() print (observation) print ( "env actionspace:" ) print (env.action_space) print ( "env observationspace:" ) print (env.observation_space) print (env.observation_space.high) print (env.observation_space.low) count = 0 for t in range ( 100 ): #随机选择一个动作 action = env.action_space.sample() #执行动作 获取环境反馈 observation, reward, done, info = env.step(action) #如果玩死了就退出 if done: break env.render() count + = 1 time.sleep( 0.2 ) print (count) |
效果图:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
2017-06-07 suse的安装命令zypper,类似apt
2017-06-07 ES transport client批量导入
2017-06-07 ES transport client使用
2017-06-07 hdfs du命令是算的一份数据