11 2020 档案

摘要:AlphaGo, AlphaZero 阅读全文

posted @ 2020-11-22 17:26 穷酸秀才大草包 阅读(786) 评论(0) 推荐(0)

摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! AAAI 2019 Best Paper Abstract RL中大量使用了有限视野的前瞻策略,并显示出令人印象深刻的经验性成功。通常,前瞻策略是通过特定的规划方法(例如,蒙特卡洛树搜索)(例如,在AlphaZero中(Silver et 阅读全文

posted @ 2020-11-21 19:59 穷酸秀才大草包 阅读(400) 评论(0) 推荐(0)

摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Journal of Artificial Intelligence Research, (2018) Abstract ALE是一个评估平台,构成了在数十种Atari 2600游戏中构建具有通用能力的AI智能体所面临的挑战。它支持各种不 阅读全文

posted @ 2020-11-17 16:20 穷酸秀才大草包 阅读(430) 评论(0) 推荐(0)

摘要:仅讨论部分RL仿真平台,下图参见AI2-THOR论文中的图: ALE是一个开源的Atari 2600模拟器。 TORCS:《The Open Racing Car Simulator》(TORCS) 是一款开源3D赛车模拟游戏。是在Linux操作系统上广受欢迎的赛车游戏。有50种车辆和20条赛道,简 阅读全文

posted @ 2020-11-16 17:00 穷酸秀才大草包 阅读(940) 评论(0) 推荐(0)

摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! FSR 2017 Conference 开源项目代码:https://github.com/Microsoft/AirSim Abstract 在现实世界中为自动驾驶飞行器开发和测试算法是一个昂贵且耗时的过程。同样,为了利用机器智能和深度 阅读全文

posted @ 2020-11-15 15:58 穷酸秀才大草包 阅读(1412) 评论(0) 推荐(0)

摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! ABSTRACT SAC是用于连续动作设置的最先进的RL算法,不适用于离散动作设置。但是,许多重要的设置都涉及离散动作,因此,在这里我们导出了适用于离散动作设置的SAC算法的替代版本。然后,我们证明了,即使没有任何超参数调整,它在Atar 阅读全文

posted @ 2020-11-14 15:31 穷酸秀才大草包 阅读(1766) 评论(0) 推荐(0)

摘要:Atari游戏介绍(ALE中集成的RL游戏环境) 阅读全文

posted @ 2020-11-13 21:20 穷酸秀才大草包 阅读(12838) 评论(1) 推荐(3)

摘要:Deep Q-Learning with Recurrent Neural Networks (DRQN) 阅读全文

posted @ 2020-11-11 16:54 穷酸秀才大草包 阅读(1009) 评论(0) 推荐(0)

摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! AAAI Fall Symposia, (2015): 29-37 Abstract 深度RL已经为复杂的任务提供了精通的控制器。但是,这些控制器的内存有限,并且依赖于能够在每个决策点感知完整的游戏画面。为了解决这些缺点,本文研究了用循环 阅读全文

posted @ 2020-11-10 10:43 穷酸秀才大草包 阅读(591) 评论(0) 推荐(0)

摘要:循环SNN 阅读全文

posted @ 2020-11-07 22:14 穷酸秀才大草包 阅读(1167) 评论(0) 推荐(0)

摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Arxiv:https://arxiv.org/abs/1812.05905 Abstract 无模型的深度RL算法已成功应用于一系列具有挑战性的序列决策和控制任务。但是,这些方法通常面临两个主要挑战:高样本复杂性和超参数的脆弱性。这两个 阅读全文

posted @ 2020-11-02 19:07 穷酸秀才大草包 阅读(888) 评论(0) 推荐(0)

导航