摘要:
**发表时间:**2021(ICML 2021) **文章要点:**这篇文章提出了latent collocation method (LatCo)算法,用来planning状态序列,而不是动作序列,来解决long horizon的planning问题(it is easier to solve l 阅读全文
摘要:
**发表时间:**2018(ICRA 2018) **文章要点:**这篇文章提出了一个叫model-based and model-free (Mb-Mf)的算法,先用model based的方法训一个policy,再用model free的方法来fine tune。具体的,先学一个model,然后 阅读全文