随笔分类 -  博弈论与强化学习

摘要:飞机游戏六 空战环境 6.1 DBRML 6.1.5 动作空间设置 动作空间 1 连续动作空间 空间范围 # 飞机的动作空间 self.action_space = Box( low=np.array([ 0, # 推力 -1, # Pitch 俯仰角 -1, # Roll 翻滚角 -1, # Ya 阅读全文
posted @ 2023-03-23 21:50 英飞 阅读(572) 评论(2) 推荐(1) 编辑
摘要:矩阵博弈中的混合策略求解 我们已经看到, 矩阵博弈可能没有鞍点或纯策略纳什均衡。然而, 当我们允许混合策略时, 均衡必定存在。令 x=(x1,,xm) 表示行参与人的混合策略, y=(y1,,yn) 为列参与 阅读全文
posted @ 2023-02-22 21:25 英飞 阅读(866) 评论(1) 推荐(0) 编辑
摘要:飞机游戏六空战强化学习环境6.1DBML 6.1.3 DBML+强化学习算法使用 项目文件结构 doc 是指导文档,tutorial.ipynb也是指导项目的配置与安装的文件 src目录下是主要的环境和模型所在位置, 其中environment是作者根据以jsbsim和dogfight2作为仿真软件 阅读全文
posted @ 2022-12-11 21:48 英飞 阅读(617) 评论(0) 推荐(2) 编辑
摘要:飞机游戏三仿真软件 3.3 Dogfight介绍 1 项目地址 GitHub - harfang3d/dogfight-sandbox-hg2: Air to air combat sandbox, created in Python 3 using the HARFANG 3D 2 framewo 阅读全文
posted @ 2022-12-10 22:33 英飞 阅读(939) 评论(0) 推荐(0) 编辑
摘要:DBML源码阅读与分析 项目文件结构 doc 是指导文档,tutorial.ipynb也是指导项目的配置与安装的文件 src目录下是主要的环境和模型所在位置, 其中environment是作者根据以jsbsim和dogfight2作为仿真软件,编写的符合gym框架下的环境,在使用的时候需要将环境复制 阅读全文
posted @ 2022-12-10 22:30 英飞 阅读(660) 评论(0) 推荐(1) 编辑
摘要:飞机游戏六 空战强化学习环境1—DBML 使用 一 Github 地址 GitHub - mrwangyou/DBRL: A Gym Dogfighting Simulation Benchmark for Reinforcement Learning Research 二 项目简介 使用gym框架 阅读全文
posted @ 2022-12-09 10:02 英飞 阅读(757) 评论(0) 推荐(0) 编辑
摘要:飞机游戏三仿真软件 3.1JSBSim介绍 1 介绍 JSBSim Open Source Flight Dynamics Model (sourceforge.net) 发布 ·JSBSim-Team/jsbsim ·GitHub 2 xml配置文件解析 【jsbsim学习】飞行器模型配置文件解读 阅读全文
posted @ 2022-12-08 16:02 英飞 阅读(2206) 评论(0) 推荐(0) 编辑
摘要:二 空战可视化+强化学习 1 jsbsim + FlighterGear jsbsim 介绍 : JSBSim Open Source Flight Dynamics Model (sourceforge.net) 安装 GitHub - JSBSim-Team/jsbsim: An open so 阅读全文
posted @ 2022-12-07 23:03 英飞 阅读(2348) 评论(0) 推荐(0) 编辑
摘要:gym1——自定义Gym环境并注册 感谢 强化学习实战 第一讲 gym学习及二次开发 - 知乎 (zhihu.com) 开始 Step 0 新建文件夹 Gym的环境都保存在gym/envs目录下,envs目录下包含了各种类型的环境例如:atari、classic_control等,我们可以在这下目录 阅读全文
posted @ 2022-12-07 10:08 英飞 阅读(1140) 评论(0) 推荐(0) 编辑
摘要:内容稍后就来 阅读全文
posted @ 2022-11-20 19:09 英飞 阅读(425) 评论(0) 推荐(0) 编辑
摘要:博弈论与强化学习——基础1 扩展型博弈 表示形式—— 博弈树 使用树状图来表示行动的次序和执行动作时的信息状态 图中有两个参与者 ,进行了两个阶段的博弈 结点:表示博弈的状态, 根节点:博弈的起点,玩家进行决策。关于博弈怎么开始,博弈的顺序,可以有预定的顺序也可以通过掷色子、投硬币决定等。 非叶子结 阅读全文
posted @ 2022-11-20 19:08 英飞 阅读(779) 评论(0) 推荐(0) 编辑
摘要:博弈解与强化学习 二 基础算法 2.1 引言 一个随机博弈可以看成是一个多智能体强化学习过程,但其实这两个概念不能完全等价,随机博弈中假定每个状态的奖励矩阵是已知的,不需要学习。而多智能体强化学习则是通过与环境的不断交互来学习每个状态的奖励值函数,再通过这些奖励值函数来学习得到最优纳什策略。通常情况 阅读全文
posted @ 2022-11-20 18:57 英飞 阅读(3477) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示