02 2025 档案

X00219-分层强化学习注意力机制无人机自动巡航airsim仿真

摘要：完整gou买链接：https://mbd.pub/o/bread/aJWVlZpu 为了提高DRL的鲁棒性，使用了均值估计函数，而不是常规的价值估计函数。然后，设计了一个递归网络和一个时序注意力机制，以提高算法的性能。第三，提出了一个层次化框架，以提升其在长期任务中的表现。一些现实的仿真环境以及实际阅读全文

posted @ 2025-02-26 15:59 algoboom 编辑

X00389-基于深度强化学习的多无人机协同围捕方法python实现

摘要：完整gou买链接见文末针对复杂障碍环境下的动态目标围捕问题, 本文提出一种基于深度强化学习的多无人机协同围捕方法. 完整内容： https://mbd.pub/o/bread/aJWVlZZx 阅读全文

posted @ 2025-02-26 14:39 algoboom 编辑

X00221-基于多智能体强化学习的车联网频谱共享python完整代码

摘要：研究基于多智能体强化学习的车联网频谱共享问题，其中多个车与车（V2V）链路复用由车与基础设施（V2I）链路占用的频谱。由于高速移动的车联网环境中信道变化快速，导致基站无法收集到准确的瞬时信道状态信息，从而无法进行集中式资源管理。对此，将资源共享建模为一个多智能体强化学习问题，并采用基于指纹的深度Q网阅读全文

posted @ 2025-02-23 18:22 algoboom 编辑

公告

昵称： algoboom
园龄： 4个月
粉丝： 1
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

02 2025 档案

公告

搜索

常用链接

随笔档案

阅读排行榜

评论排行榜

最新评论