强化学习论文解读——无人机的创新

 就是先讲一下背景知识嘛,随着人类科技的发展,人工智能也发展的不错,一些无人驾驶设备也包括无人机(本文主人公),在搜索人类难以到达的地方做出了极大贡献,然后话锋一转,但是啊。。。。要是你场景比较复杂呢,你目前现有的技术是够呛的,因为你的伸展性,和高效联合性都不太够;更进一步呢,当你任务场景变得更大之后,你的实时全球信息供应的效率是很难跟上需求的,因此我们需要当地信息供应。好了背景讲得差不多了。。我们的成果啊啊啊!!就是专注于大环境!大场景!,把它细分得很小,来提供当地信息并运用到UAV,因为搜寻场景比较复杂,就需要高适应性的决策制定,这建模成马尔可夫决策过程是比较合适的,对于基于结果的大场景,我们提出了分布式联合搜寻发,基于mar然后下面是一些方法的优势什么的,方法介绍,(细说不了一点,再细说我就相当于翻译全文了,受不了)

 

 

然后就是无人机发展的不错,运用场景很广,应用场景包括搜寻,救援任务,农业探测等等,然后因为真的很厉害,很多人都去研究,相比于传统,UAV确实它的优势太多了,然后展开细说优势

 

 然后结尾又讲了UAV(进步的它)运用场景还包括找人,辨识危机,进入灾区

 

 

 然后这段大概就是说,你任务一旦复杂起来,单一的UAV很难办,所以就有了UAV 集群,然后引出了其中一种方法叫做集中法,有讲到集中法的好处,但主要还是展开细说集中法它的局限性,在一些较为复杂的场景有局限

 

 拷打完集中法,接下来就是爆夸咱们的分布式,然后就是展开一直夸,主打一个对比

 虽然啊,我们的分布式很强啊,但还是解决不了所有问题啊,接下来开始拷打全球信息,有局限性,而且在一些地方非常严重,然后再主打一个对比,疯狂夸赞咱们的本地信息

 

 

 然后开了一段展开细说另一个问题,就是你场景太大了,任务太复杂了,然后你大环境太难了变化多端,细说完问题就是老套路。。为了解决这个问题啊。。。我们呢可以把一个大地图分解成好几个小地图,然后我们给搜寻过程建模,基于MDP法,运用了MARL,MARL的用途,还运用了MADDPG来控制集群,而且我们的方法用实验证明过捏,然后展开细说我们成果的一些贡献

 为了处理实时的准确的全球消息,我们的做法,把大环境拆小,这样UAV可以很好地运用全球和本地消息来解决问题

 然后接下来讲,UAV为啥被需要(有活力的nature,还有为了应答改变的大环境,以及UAV的灵活),UAV可以建立明确的方法在(s,a,r)三件套,然后下面就是一些好处

 

 

 

就是一个大佬又提出了一种算法叫做

“vehicle routing algorithm ”inspired by the thermalling
technique used in glider operations,解决了搜寻路径问题和频繁的噪音信号,以及下面还有个大佬又提出了一种方法基于地理分析的,但是呢,老样子,一旦任务复杂一繁多,他们就都废了
 
 
 
接下来老套路。。。,为了解决这个问题。。。。。
 
下面这段就是列举一系列大佬提出的一系列方法啊,策略啊,算法,可以解决无人机联合控制问题,多无人机搜寻区域覆盖问题,提高在不确定区域的联合搜寻问腿,联合控制表现,优化卸载任务计算和不确定环境的交流问题,还有集群技术联合目标搜寻,然后,再来个转折,上文提到,你再牛逼,你都是集中法,只要你是集中法,你就是不行,一旦任务复杂起来,集中法就会暴露缺陷,就会导致计算和交流问题,然后接着引出下文
 

 集中法不太行,所以咱们就都来研究分布式方法:无人机协同搜索算法,

分布式自组织,自主协同搜索的改进搜索算法,好处:自主协作和协调,彼此在未知环境中执行高效的搜索任务,不依赖于集中控制系统的环境,

竞争粒子群优化算法减少

整体搜索时间缩短,提高检测效率。

 

 

不过啊,虽然啊,现成的很多方法都很有用啊,但是啊,还是那句话,一旦场景和任务复杂起来,就废了啊,所以主角终于要登场了(我们的产品。。。!!!!)

 

 

 

 

拆分了大规模搜索场景整合局部信息,

提出新颖的设想,基于marl的无人机群搜索方法

实现类在可扩展性和效率方面的提高

posted @ 2023-12-10 12:39  糖子哥  阅读(93)  评论(1编辑  收藏  举报