论文阅读:Robot Program Parameter Inference via Differentiable Shadow Program Inversion
标题:Robot Program Parameter Inference via Differentiable Shadow Program Inversion
作者:Benjamin Alt1,2 , Darko Katic1 , Rainer Jakel ¨ 1 , Asil Kaan Bozcuoglu2 and Michael Beetz
0. 摘要
通过结合个体机器人技能可以有效地解决具有挑战性的操作任务,这些技能必须针对具体的物理环境和手头的任务进行参数化。这对于人类程序员来说既耗时又困难,尤其是对于力控制技能而言。为此,我们提出了影子程序反转 (SPI),这是一种直接从数据推断最佳技能参数的新方法。 SPI 利用无监督学习来训练辅助可微程序表示(“影子程序”),并通过基于梯度的模型反演实现参数推理。我们的方法能够使用高效的一阶优化器来推断最初不可微的技能的最佳参数,包括目前生产中使用的许多技能变体。 SPI 零样本跨任务目标泛化,这意味着不需要重新训练影子程序来推断不同任务变体的参数。我们在工业和家庭场景中的三种不同机器人和技能框架上评估我们的方法。代码和示例可从 https://innolab.artiminds.com/icra2021 获得。
1.