Apprenticeship Learning via Inverse Reinforcement Learning

[source] ICML

[year] 2004

在本文中直接提出了两个算法:MMP和Projection方法。

Projection方法比较容易，可以找到实现。

找一个下降方向。

困难在于建模，如何找出MDP/R的各构成。其中的S A \phi都不那么明显。

posted @ 2011-06-05 13:39 justin_s 阅读(513) 评论(0) 编辑收藏举报

刷新页面返回顶部