2024 年 3月 24 日随笔档案 - 英飞

2024年3月24日

摘要：将JSBSim放进强化学习中 1 JSBSim模型 1 状态获取位置：横轴，纵轴，竖轴坐标 \(x,y,z\) fdm["position/lat-gc-deg"] # Latitude fdm["position/long-gc-deg"] # Longitude fdm["positio 阅读全文

posted @ 2024-03-24 18:48 英飞阅读(753) 评论(0) 推荐(0) 编辑

空战编程实现——6 强化学习与控制器

摘要：目录1 付宇鹏,邓向阳,何明,等. 基于强化学习的固定翼飞机姿态控制方法研究_付宇鹏[J]. 控制与决策, : 1-6.输入输出模型结构强化学习方法——ppo奖励函数设置实现平台训练技巧效果2 马一鸣. 基于强化学习的前馈控制器[D]. 华北电力大学(北京), 2021.强化学习自适应补偿控制系统阅读全文

posted @ 2024-03-24 18:47 英飞阅读(578) 评论(0) 推荐(0) 编辑

空战博弈编程实现

摘要： AirSim 环境搭建目录AirSim 环境搭建感谢一 AirSim简介二 vs2019三虚幻引擎四下载编译五环境的使用1 要把Epic Game语言改为英文2 create Project3 创建C++类。4 复制Plugin5 打开sln文件，进行调试6 场景设置7 运行8 视角调节9 阅读全文

posted @ 2024-03-24 18:45 英飞阅读(376) 评论(0) 推荐(0) 编辑

空战博弈编程实现——gym+jsbsim

摘要：笔记 1 珠玉在前论文1 Richter D J, Calix R A. QPlane: An Open-Source Reinforcement Learning Toolkit for Autonomous Fixed Wing Aircraft Simulation[C]//Proceedi 阅读全文

posted @ 2024-03-24 18:45 英飞阅读(1545) 评论(0) 推荐(0) 编辑

空战博弈实现——3 gym自定义环境

摘要： gym1——自定义Gym环境并注册目录gym1——自定义Gym环境并注册感谢开始Step 0 新建文件夹Step1：新建环境文件 xxEnv.pyStep2：在env下的_ _ init _ _ .py下注册**Step3 ** 添加新建环境文件夹的引用Step4：在算法中进行调用感谢强化学阅读全文

posted @ 2024-03-24 18:44 英飞阅读(562) 评论(0) 推荐(0) 编辑

空战博弈编程实现——2 初探JSBSIM

摘要： [原][JSBSIM]aircraft飞机xml脚本 - 南水之源 - 博客园 (cnblogs.com) 1 安装python版本 jsbsim 发布 ·JSBSim-Team/jsbsim ·GitHub Jsbsim :: Anaconda.org conda install -c conda 阅读全文

posted @ 2024-03-24 18:43 英飞阅读(1549) 评论(0) 推荐(0) 编辑

空战编程实现1——小雅

摘要：小雅环境和自定义gym融合自定义Gym环境并注册 Gym的环境都保存在gym/envs目录下，envs目录下包含了各种类型的环境例如：atari、classic_control等，我们研究飞行器等类型问题所建立的自定义环境一般可以放在classic_control中。 Step1：建立环境文件在阅读全文

posted @ 2024-03-24 18:42 英飞阅读(293) 评论(0) 推荐(0) 编辑

分层强化学习

摘要：分层强化学习目录分层强化学习Option在MDP模型中加入OptionHAM （Hierarchical Abstract Machines）MAXQ自动分层研究仿真实验1 多出租车问题2 垃圾收集3 多机器人足球4 多机器人搜救 HRL方法通过引入抽象( Abstraction)机制来实现状态空阅读全文

posted @ 2024-03-24 18:39 英飞阅读(267) 评论(0) 推荐(0) 编辑

问题建模

摘要：问题建模异构多智能体战场决策所有智能体之间在无直接通讯的情况下完全独立决策，分别由不同的程序控制并可以运行在不同的主机上 POSG模型给了我们一个更好的理解不确定环境下多智能体规划问题的途径，但在这里问题的规模是最大的挑战。最基本的做法是采用分层设计的思想(Stone P, 1998)，将整个阅读全文

posted @ 2024-03-24 18:38 英飞阅读(89) 评论(0) 推荐(0) 编辑

马尔可夫决策理论

摘要：马尔可夫决策理论马尔可夫性（无后效性）某阶段的状态一旦确定则此后过程的演变不再受此前各状态的影响。也就是说“未来与过去无关”当前的状态是此前历史的一个完整总结，此前的历史只能通过当前的状态去影响过程未来的演变。把握“当前的状态是此前历史的一个完整总结”这一要点后很多过程可以被转化描述为马尔阅读全文

posted @ 2024-03-24 18:38 英飞阅读(363) 评论(0) 推荐(0) 编辑

多智能体理论

摘要：多智能体理论智能体的基本特性 woofdridge和J七nnLings在总结了前人在agent领域的一些工作后认为Agent的基本特性包括: (l)自治性:Agent运行时不直接由人或者其他东西控制它对它们自己的行为和内部状态有一定的控制权。 (2)社会性:Agent能够通过某种Agent通信阅读全文

posted @ 2024-03-24 18:37 英飞阅读(192) 评论(0) 推荐(0) 编辑

英飞

卧龙岗闲散人

公告