feifanren

2020年11月22日

论文阅读：Unsupervised Visual-Linguistic Reference Resolution in Instructional Videos

摘要： Unsupervised Visual-Linguistic Reference Resolution in Instructional Videos We propose an unsupervised method for reference res-olution in instruction 阅读全文

posted @ 2020-11-22 18:32 feifanren 阅读(106) 评论(0) 推荐(0) 编辑

论文阅读：PURPOSIVE VISUAL IMITATION FOR LEARNING STRUCTURED TASKS FROM VIDEOS ADISSERTATION

摘要： PURPOSIVE VISUAL IMITATION FOR LEARNING STRUCTURED TASKS FROM VIDEOS ADISSERTATION 有目的的视觉模仿，以学习视频中的结构化任务我们提出有目的的视觉模仿，从视频中了解演示者的目标和意图。我们证明，与从视频中学习低级轨阅读全文

posted @ 2020-11-22 14:47 feifanren 阅读(117) 评论(0) 推荐(0) 编辑

2020年11月20日

论文阅读：LINS: A Lidar-Inertial State Estimator for Robust and Efficient Navigation

摘要： LINS: A Lidar-Inertial State Estimator for Robust and Efficient Navigation LINS：用于鲁棒高效导航的激光雷达惯性状态估计器 —我们介绍了LINS，它是一种轻量级的激光雷达惯性状态估计器，用于实时自我运动估计。所提出的方法阅读全文

posted @ 2020-11-20 22:29 feifanren 阅读(939) 评论(0) 推荐(0) 编辑

论文阅读：基于目标的模仿学习的运动推理

摘要：基于目标的模仿学习的运动推理 Motion Reasoning for Goal-Based Imitation Learning De-An Huang1,2, Yu-Wei Chao∗,2, Chris Paxton∗,2, Xinke Deng2,3,Li Fei-Fei1, Juan Car 阅读全文

posted @ 2020-11-20 20:32 feifanren 阅读(144) 评论(0) 推荐(0) 编辑

【顶会论文】CoRL2020 robot learning 相关论文汇总

摘要： [7]. Augmenting GAIL with BC for sample efficient imitation learning 作者: Rohit Kumar Jena (Carnegie Mellon University)*; Changliu Liu (Carnegie Mellon 阅读全文

posted @ 2020-11-20 10:13 feifanren 阅读(282) 评论(0) 推荐(0) 编辑

2020年11月18日

论文阅读：通过构建技能树从演示中学习机器人

摘要： Robot Learning from Demonstration by Constructing Skill Trees 通过构建技能树从演示中学习机器人我们描述了CST，这是一种根据演示轨迹构建技能树的在线算法。 CST将演示轨迹划分为组件技能链，其中每个技能都有一个目标，并从抽象库中分配了合阅读全文

posted @ 2020-11-18 22:43 feifanren 阅读(133) 评论(0) 推荐(0) 编辑

2020年9月8日

matlab中 meshgrid 函数的用法

摘要： meshgrid 的使用方法： [X,Y] = meshgrid(x,y) 将向量x和y定义的区域转换成矩阵X和Y，这两个矩阵可以用来表示mesh和surf的三维空间点以及两个变量的赋值。其中矩阵X的行向量是向量x的简单复制，而矩阵Y的列向量是向量y的简单复制。 Generate X and Y m 阅读全文

posted @ 2020-09-08 14:17 feifanren 阅读(2731) 评论(0) 推荐(0) 编辑

2020年8月29日

强化学习学习笔记：Policy Gradient Methods

摘要：一.学习目标了解基于价值和基于策略的强化学习之间的区别了解REINFORCE算法（蒙特卡洛策略梯度）了解Actor-Critic（AC）算法了解优势函数了解确定性策略梯度（可选）了解如何使用异步Actor-Critic算法和神经网络扩展Policy Gradient方法（可选） 1.了解阅读全文

posted @ 2020-08-29 12:13 feifanren 阅读(518) 评论(0) 推荐(0) 编辑

2020年8月26日

强化学习学习笔记：Q-learning无模型算法

摘要：强化学习按理解环境的程度可以划分为无模型和有模型,Q-Learning算法是典型的无模型强化学习算法,与有模型的强化学习算法的区别是它的后继状态$[S']$未知，只能通过与环境交互以试验和采样的方法得到一个后继状态$[S']$。所以Q-Learning算法仅由元组$[\left( {S,A, 阅读全文

posted @ 2020-08-26 20:58 feifanren 阅读(1354) 评论(0) 推荐(0) 编辑

2020年8月24日

强化学习学习笔记（五）：值函数估计

摘要： #学习目标 1.了解表查找中函数逼近的动机 2.了解如何将函数逼近合并到现有算法中 3.了解函数逼近器和RL算法的收敛特性 4.了解使用经验重播的批处理 #总结 1.建立一个大表（每个状态或状态-动作对一个值）会导致内存和数据效率低下。通过使用特征化状态表示，函数逼近可以推广到看不见的状态。 2. 阅读全文

posted @ 2020-08-24 10:37 feifanren 阅读(494) 评论(0) 推荐(0) 编辑

公告