摘要: [source] ICML [year] 2006 to automate the mapping from perception features to costs 不再只是与一个点(期望)间的距离,而是与示例数据点集间的距离 文章先提出Quadratic Programming Formulation 再Efficient Optimization,有伪代码,取subgradient 方向,即... 阅读全文
posted @ 2011-06-05 19:46 justin_s 阅读(824) 评论(0) 推荐(0) 编辑
摘要: [source] siggraph [year] 2010 在动作图上使用控制器以达到某目标,要有一个好的reward function,靠手工不准确且繁琐,提出IRL方法 Related Word 1.Motion Graph方面 DP与RL 2.IRL 3.Movement Style Motion Controller Model IRL 1.Definition 2.Apprentices... 阅读全文
posted @ 2011-06-05 19:37 justin_s 阅读(172) 评论(0) 推荐(0) 编辑
摘要: [source] ICML [year] 2004 在本文中直接提出了两个算法:MMP和Projection方法。 Projection方法比较容易,可以找到实现。 找一个下降方向。 困难在于建模,如何找出MDP/R的各构成。其中的S A \phi都不那么明显。 阅读全文
posted @ 2011-06-05 13:39 justin_s 阅读(512) 评论(0) 推荐(0) 编辑