Q学习使用ROS和Gazebo的turtlebot的迷宫导航
https://github.com/senthilarul/QLearning-ENPM808X
自动机器人是影响科技行业的下一个重要因素。随着谷歌,亚马逊和苹果等科技巨头在自主技术上投入巨资,可以肯定这些机器人将在不久的将来对我们的生活产生重大影响。
当机器人处于未开发的环境中时,它不知道要为该环境执行的最佳操作集,以便在不发生冲突的情况下自主导航。在这个软件中,我们以一个导航迷宫的turtlebot为例。虽然Turtlebot处于操作环境中,但在导航整个环境之前几乎不可能为这些状态定义所有可能的状态和操作。即使这种情况是可能的,也可能不适合新环境。在这些情况下,使用一系列奖励来训练代理执行它所执行的随机操作要容易得多。这是Q学习发挥作用的地方。在给定状态的情况下,当代理执行期望的动作(不与障碍物碰撞)时,代理被积极奖励。同样的,当它执行不良行为(如与障碍物碰撞)时会得到负面回报。使用奖励作为学习输入时,很容易在所有状态和操作上定义数值评估函数,并将最优策略建立在此评估函数上。
该项目将实施一种Qlerning算法,用于训练turtlebot通过避开障碍物在迷宫内创建(在凉亭上创建)。该项目将通过使用演示来显示算法的工作,该演示显示在迷宫内导航的turtlebot而不会发生碰撞。
文件
完整视频(演示+安装+培训和测试演示):https: //www.youtube.com/watch?v = qqqZj9iZp64
完整视频已分为演示和演示:
只需在此处查看演示文稿部分:https: //www.youtube.com/watch?v = k43GkDqWK9E
可以在此处查看演示部分:https: //www.youtube.com/watch?v = CnOc-quSAEc