摘要: 将JSBSim放进强化学习中 1 JSBSim模型 1 状态获取 位置 : 横轴,纵轴,竖轴 坐标 \(x,y,z\) fdm["position/lat-gc-deg"] # Latitude fdm["position/long-gc-deg"] # Longitude fdm["positio 阅读全文
posted @ 2024-03-24 18:48 英飞 阅读(560) 评论(0) 推荐(0) 编辑
摘要: 目录1 付宇鹏,邓向阳,何明,等. 基于强化学习的固定翼飞机姿态控制方法研究_付宇鹏[J]. 控制与决策, : 1-6.输入输出模型结构强化学习方法——ppo奖励函数设置实现平台 训练技巧效果2 马一鸣. 基于强化学习的前馈控制器[D]. 华北电力大学(北京), 2021.强化学习自适应补偿控制系统 阅读全文
posted @ 2024-03-24 18:47 英飞 阅读(420) 评论(0) 推荐(0) 编辑
摘要: AirSim 环境搭建 目录AirSim 环境搭建感谢一 AirSim简介二 vs2019三 虚幻引擎四 下载编译五 环境的使用1 要把Epic Game语言改为英文2 create Project3 创建C++类。4 复制Plugin5 打开sln文件,进行调试6 场景设置7 运行8 视角调节9 阅读全文
posted @ 2024-03-24 18:45 英飞 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 笔记 1 珠玉在前 论文1 Richter D J, Calix R A. QPlane: An Open-Source Reinforcement Learning Toolkit for Autonomous Fixed Wing Aircraft Simulation[C]//Proceedi 阅读全文
posted @ 2024-03-24 18:45 英飞 阅读(1187) 评论(0) 推荐(0) 编辑
摘要: gym1——自定义Gym环境并注册 目录gym1——自定义Gym环境并注册感谢开始Step 0 新建文件夹Step1:新建环境文件 xxEnv.pyStep2: 在env下的_ _ init _ _ .py下注册**Step3 ** 添加新建环境文件夹的引用Step4:在算法中进行调用 感谢 强化学 阅读全文
posted @ 2024-03-24 18:44 英飞 阅读(437) 评论(0) 推荐(0) 编辑
摘要: [原][JSBSIM]aircraft飞机xml脚本 - 南水之源 - 博客园 (cnblogs.com) 1 安装python版本 jsbsim 发布 ·JSBSim-Team/jsbsim ·GitHub Jsbsim :: Anaconda.org conda install -c conda 阅读全文
posted @ 2024-03-24 18:43 英飞 阅读(1201) 评论(0) 推荐(0) 编辑
摘要: 小雅环境和自定义gym融合 自定义Gym环境并注册 Gym的环境都保存在gym/envs目录下,envs目录下包含了各种类型的环境例如:atari、classic_control等,我们研究飞行器等类型问题所建立的自定义环境一般可以放在classic_control中。 Step1:建立环境文件 在 阅读全文
posted @ 2024-03-24 18:42 英飞 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 分层强化学习 目录分层强化学习Option在MDP模型中加入OptionHAM (Hierarchical Abstract Machines)MAXQ自动分层研究仿真实验1 多出租车问题2 垃圾收集3 多机器人足球4 多机器人搜救 HRL方法通过引入抽象( Abstraction)机制来实现状态空 阅读全文
posted @ 2024-03-24 18:39 英飞 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 问题建模 异构多智能体战场决策 所有智能体之间在无直接通讯的情况下完全独立决策,分别由不同的程序控制‚并可以运行在不同的主机上 POSG模型给了我们一个更好的理解不确定环境下多智能体规划问题的途径,但在这里问题的规模是最大的挑战。最基本的做法是采用分层设计的思想(Stone P, 1998),将整个 阅读全文
posted @ 2024-03-24 18:38 英飞 阅读(65) 评论(0) 推荐(0) 编辑
摘要: 马尔可夫决策理论 马尔可夫性( 无后效性) 某阶段的状态一旦确定‚则此后过程的演变不再受此前各状态的影响。也就是说“未来与过去无关”当前的状态是此前历史的一个完整总结,此前的历史只能通过当前的状态去影响过程未来的演变。 把握“当前的状态是此前历史的一个完整总结”这一要点后很多过程可以被转化描述为马尔 阅读全文
posted @ 2024-03-24 18:38 英飞 阅读(208) 评论(0) 推荐(0) 编辑
摘要: 多智能体理论 智能体的基本特性 woofdridge和J七nnLings在总结了前人在agent领域的一些工作后认为‚Agent的基本特性包括: (l)自治性:Agent运行时不直接由人或者其他东西控制‚它对它们自己的行为和内部状态有一定的控制权。 (2)社会性:Agent能够通过某种Agent通信 阅读全文
posted @ 2024-03-24 18:37 英飞 阅读(122) 评论(0) 推荐(0) 编辑