上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 54 下一页
摘要: Unsupervised Visual-Linguistic Reference Resolution in Instructional Videos We propose an unsupervised method for reference res-olution in instruction 阅读全文
posted @ 2020-11-22 18:32 feifanren 阅读(106) 评论(0) 推荐(0) 编辑
摘要: PURPOSIVE VISUAL IMITATION FOR LEARNING STRUCTURED TASKS FROM VIDEOS ADISSERTATION 有目的的视觉模仿,以学习视频中的结构化任务 我们提出有目的的视觉模仿,从视频中了解演示者的目标和意图。 我们证明,与从视频中学习低级轨 阅读全文
posted @ 2020-11-22 14:47 feifanren 阅读(117) 评论(0) 推荐(0) 编辑
摘要: LINS: A Lidar-Inertial State Estimator for Robust and Efficient Navigation LINS:用于鲁棒高效导航的激光雷达惯性状态估计器 —我们介绍了LINS,它是一种轻量级的激光雷达惯性状态估计器,用于实时自我运动估计。 所提出的方法 阅读全文
posted @ 2020-11-20 22:29 feifanren 阅读(939) 评论(0) 推荐(0) 编辑
摘要: 基于目标的模仿学习的运动推理 Motion Reasoning for Goal-Based Imitation Learning De-An Huang1,2, Yu-Wei Chao∗,2, Chris Paxton∗,2, Xinke Deng2,3,Li Fei-Fei1, Juan Car 阅读全文
posted @ 2020-11-20 20:32 feifanren 阅读(144) 评论(0) 推荐(0) 编辑
摘要: [7]. Augmenting GAIL with BC for sample efficient imitation learning 作者: Rohit Kumar Jena (Carnegie Mellon University)*; Changliu Liu (Carnegie Mellon 阅读全文
posted @ 2020-11-20 10:13 feifanren 阅读(282) 评论(0) 推荐(0) 编辑
摘要: Robot Learning from Demonstration by Constructing Skill Trees 通过构建技能树从演示中学习机器人 我们描述了CST,这是一种根据演示轨迹构建技能树的在线算法。 CST将演示轨迹划分为组件技能链,其中每个技能都有一个目标,并从抽象库中分配了合 阅读全文
posted @ 2020-11-18 22:43 feifanren 阅读(133) 评论(0) 推荐(0) 编辑
摘要: meshgrid 的使用方法: [X,Y] = meshgrid(x,y) 将向量x和y定义的区域转换成矩阵X和Y,这两个矩阵可以用来表示mesh和surf的三维空间点以及两个变量的赋值。其中矩阵X的行向量是向量x的简单复制,而矩阵Y的列向量是向量y的简单复制。 Generate X and Y m 阅读全文
posted @ 2020-09-08 14:17 feifanren 阅读(2731) 评论(0) 推荐(0) 编辑
摘要: 一.学习目标 了解基于价值和基于策略的强化学习之间的区别 了解REINFORCE算法(蒙特卡洛策略梯度) 了解Actor-Critic(AC)算法 了解优势函数 了解确定性策略梯度(可选) 了解如何使用异步Actor-Critic算法和神经网络扩展Policy Gradient方法(可选) 1.了解 阅读全文
posted @ 2020-08-29 12:13 feifanren 阅读(518) 评论(0) 推荐(0) 编辑
摘要: 强化学习按理解环境的程度可以划分为无模型和有模型,Q-Learning算法是典型的无模型强化学习算法,与有模型的强化学习算法的区别是它的后继状态$[S']\(未知,只能通过与环境交互以试验和采样的方法得到一个后继状态\)[S']\(。所以Q-Learning算法仅由元组\)[\left( {S,A, 阅读全文
posted @ 2020-08-26 20:58 feifanren 阅读(1354) 评论(0) 推荐(0) 编辑
摘要: #学习目标 1.了解表查找中函数逼近的动机 2.了解如何将函数逼近合并到现有算法中 3.了解函数逼近器和RL算法的收敛特性 4.了解使用经验重播的批处理 #总结 1.建立一个大表(每个状态或状态-动作对一个值)会导致内存和数据效率低下。 通过使用特征化状态表示,函数逼近可以推广到看不见的状态。 2. 阅读全文
posted @ 2020-08-24 10:37 feifanren 阅读(494) 评论(0) 推荐(0) 编辑
上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 54 下一页