Apprenticeship Learning via Inverse Reinforcement Learning

[source] ICML

[year] 2004

 

在本文中直接提出了两个算法:MMP和Projection方法。

Projection方法比较容易,可以找到实现。

 

找一个下降方向。

 

 

困难在于建模,如何找出MDP/R的各构成。其中的S A \phi都不那么明显。

posted @ 2011-06-05 13:39  justin_s  阅读(513)  评论(0编辑  收藏  举报