博弈论与强化学习 - 随笔分类 - 英飞

飞机游戏六空战环境 6.1 DBRML 6.1.5 动作空间设置

摘要：飞机游戏六空战环境 6.1 DBRML 6.1.5 动作空间设置动作空间 1 连续动作空间空间范围 # 飞机的动作空间 self.action_space = Box( low=np.array([ 0, # 推力 -1, # Pitch 俯仰角 -1, # Roll 翻滚角 -1, # Ya 阅读全文

posted @ 2023-03-23 21:50 英飞阅读(572) 评论(2) 推荐(1) 编辑

矩阵博弈中的混合策略求解

摘要：矩阵博弈中的混合策略求解我们已经看到, 矩阵博弈可能没有鞍点或纯策略纳什均衡。然而, 当我们允许混合策略时, 均衡必定存在。令

x = (x_{1}, \dots, x_{m})

$x=\left(x_1, \cdots, x_m\right)$ 表示行参与人的混合策略,

y = (y_{1}, \dots, y_{n})

$y=\left(y_1, \cdots, y_n\right)$ 为列参与阅读全文

posted @ 2023-02-22 21:25 英飞阅读(866) 评论(1) 推荐(0) 编辑

飞机游戏六空战强化学习环境6.1DBML 6.1.4 DBML+强化学习算法使用

摘要：挖坑阅读全文

posted @ 2023-02-14 09:37 英飞阅读(358) 评论(0) 推荐(0) 编辑

飞机游戏六空战强化学习环境6.1DBML 6.1.3 DBML+强化学习算法使用

摘要：飞机游戏六空战强化学习环境6.1DBML 6.1.3 DBML+强化学习算法使用项目文件结构 doc 是指导文档，tutorial.ipynb也是指导项目的配置与安装的文件 src目录下是主要的环境和模型所在位置，其中environment是作者根据以jsbsim和dogfight2作为仿真软件阅读全文

posted @ 2022-12-11 21:48 英飞阅读(617) 评论(0) 推荐(2) 编辑

飞机游戏三仿真软件 3.3 Dogfight介绍

摘要：飞机游戏三仿真软件 3.3 Dogfight介绍 1 项目地址 GitHub - harfang3d/dogfight-sandbox-hg2: Air to air combat sandbox, created in Python 3 using the HARFANG 3D 2 framewo 阅读全文

posted @ 2022-12-10 22:33 英飞阅读(939) 评论(0) 推荐(0) 编辑

飞机游戏六空战强化学习环境 6.1DBML 6.1.2源码阅读与分析

摘要：DBML源码阅读与分析项目文件结构 doc 是指导文档，tutorial.ipynb也是指导项目的配置与安装的文件 src目录下是主要的环境和模型所在位置，其中environment是作者根据以jsbsim和dogfight2作为仿真软件，编写的符合gym框架下的环境，在使用的时候需要将环境复制阅读全文

posted @ 2022-12-10 22:30 英飞阅读(660) 评论(0) 推荐(1) 编辑

飞机游戏六空战强化学习环境6.1DBML 6.1.1DBML 使用

摘要：飞机游戏六空战强化学习环境1—DBML 使用一 Github 地址 GitHub - mrwangyou/DBRL: A Gym Dogfighting Simulation Benchmark for Reinforcement Learning Research 二项目简介使用gym框架阅读全文

posted @ 2022-12-09 10:02 英飞阅读(757) 评论(0) 推荐(0) 编辑

飞机游戏三仿真软件 3.1JSBSim介绍

摘要：飞机游戏三仿真软件 3.1JSBSim介绍 1 介绍 JSBSim Open Source Flight Dynamics Model (sourceforge.net) 发布 ·JSBSim-Team/jsbsim ·GitHub 2 xml配置文件解析【jsbsim学习】飞行器模型配置文件解读阅读全文

posted @ 2022-12-08 16:02 英飞阅读(2206) 评论(0) 推荐(0) 编辑

飞机游戏二空战可视化+强化学习

摘要：二空战可视化+强化学习 1 jsbsim + FlighterGear jsbsim 介绍： JSBSim Open Source Flight Dynamics Model (sourceforge.net) 安装 GitHub - JSBSim-Team/jsbsim: An open so 阅读全文

posted @ 2022-12-07 23:03 英飞阅读(2348) 评论(0) 推荐(0) 编辑

gym——1自定义Gym环境并注册

摘要：gym1——自定义Gym环境并注册感谢强化学习实战第一讲 gym学习及二次开发 - 知乎 (zhihu.com) 开始 Step 0 新建文件夹 Gym的环境都保存在gym/envs目录下，envs目录下包含了各种类型的环境例如：atari、classic_control等，我们可以在这下目录阅读全文

posted @ 2022-12-07 10:08 英飞阅读(1140) 评论(0) 推荐(0) 编辑

博弈论与强化学习——— 基础2 马尔科夫博弈

摘要：内容稍后就来阅读全文

posted @ 2022-11-20 19:09 英飞阅读(425) 评论(0) 推荐(0) 编辑

博弈论与强化学习——基础1 扩展型博弈

摘要：博弈论与强化学习——基础1 扩展型博弈表示形式—— 博弈树使用树状图来表示行动的次序和执行动作时的信息状态图中有两个参与者，进行了两个阶段的博弈结点：表示博弈的状态，根节点：博弈的起点，玩家进行决策。关于博弈怎么开始，博弈的顺序，可以有预定的顺序也可以通过掷色子、投硬币决定等。非叶子结阅读全文

posted @ 2022-11-20 19:08 英飞阅读(779) 评论(0) 推荐(0) 编辑

博弈论与强化学习算法一 MinimaxQ, NashQ ,FFQ

摘要：博弈解与强化学习二基础算法 2.1 引言一个随机博弈可以看成是一个多智能体强化学习过程,但其实这两个概念不能完全等价，随机博弈中假定每个状态的奖励矩阵是已知的，不需要学习。而多智能体强化学习则是通过与环境的不断交互来学习每个状态的奖励值函数，再通过这些奖励值函数来学习得到最优纳什策略。通常情况阅读全文

posted @ 2022-11-20 18:57 英飞阅读(3477) 评论(0) 推荐(0) 编辑

英飞

卧龙岗闲散人

随笔分类 - 博弈论与强化学习

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

合集 (2)

随笔分类 (258)

随笔档案 (124)

阅读排行榜

评论排行榜

推荐排行榜

最新评论