强化学习论文解读——无人机的创新
就是先讲一下背景知识嘛,随着人类科技的发展,人工智能也发展的不错,一些无人驾驶设备也包括无人机(本文主人公),在搜索人类难以到达的地方做出了极大贡献,然后话锋一转,但是啊。。。。要是你场景比较复杂呢,你目前现有的技术是够呛的,因为你的伸展性,和高效联合性都不太够;更进一步呢,当你任务场景变得更大之后,你的实时全球信息供应的效率是很难跟上需求的,因此我们需要当地信息供应。好了背景讲得差不多了。。我们的成果啊啊啊!!就是专注于大环境!大场景!,把它细分得很小,来提供当地信息并运用到UAV,因为搜寻场景比较复杂,就需要高适应性的决策制定,这建模成马尔可夫决策过程是比较合适的,对于基于结果的大场景,我们提出了分布式联合搜寻发,基于mar然后下面是一些方法的优势什么的,方法介绍,(细说不了一点,再细说我就相当于翻译全文了,受不了)
然后就是无人机发展的不错,运用场景很广,应用场景包括搜寻,救援任务,农业探测等等,然后因为真的很厉害,很多人都去研究,相比于传统,UAV确实它的优势太多了,然后展开细说优势
然后结尾又讲了UAV(进步的它)运用场景还包括找人,辨识危机,进入灾区
然后这段大概就是说,你任务一旦复杂起来,单一的UAV很难办,所以就有了UAV 集群,然后引出了其中一种方法叫做集中法,有讲到集中法的好处,但主要还是展开细说集中法它的局限性,在一些较为复杂的场景有局限
拷打完集中法,接下来就是爆夸咱们的分布式,然后就是展开一直夸,主打一个对比
虽然啊,我们的分布式很强啊,但还是解决不了所有问题啊,接下来开始拷打全球信息,有局限性,而且在一些地方非常严重,然后再主打一个对比,疯狂夸赞咱们的本地信息
然后开了一段展开细说另一个问题,就是你场景太大了,任务太复杂了,然后你大环境太难了变化多端,细说完问题就是老套路。。为了解决这个问题啊。。。我们呢可以把一个大地图分解成好几个小地图,然后我们给搜寻过程建模,基于MDP法,运用了MARL,MARL的用途,还运用了MADDPG来控制集群,而且我们的方法用实验证明过捏,然后展开细说我们成果的一些贡献
为了处理实时的准确的全球消息,我们的做法,把大环境拆小,这样UAV可以很好地运用全球和本地消息来解决问题
然后接下来讲,UAV为啥被需要(有活力的nature,还有为了应答改变的大环境,以及UAV的灵活),UAV可以建立明确的方法在(s,a,r)三件套,然后下面就是一些好处
就是一个大佬又提出了一种算法叫做
集中法不太行,所以咱们就都来研究分布式方法:无人机协同搜索算法,
分布式自组织,自主协同搜索的改进搜索算法,好处:自主协作和协调,彼此在未知环境中执行高效的搜索任务,不依赖于集中控制系统的环境,
竞争粒子群优化算法减少
整体搜索时间缩短,提高检测效率。
不过啊,虽然啊,现成的很多方法都很有用啊,但是啊,还是那句话,一旦场景和任务复杂起来,就废了啊,所以主角终于要登场了(我们的产品。。。!!!!)
拆分了大规模搜索场景整合局部信息,
提出新颖的设想,基于marl的无人机群搜索方法
实现类在可扩展性和效率方面的提高