摘要: 发表时间: 2023 (NeurIPS 2023) 文章要点: 文章提出一个evolvable LLM-based agent框架REMEMBERER,主要思路是给大模型加一个experience memory存储过去的经验,然后用Q-learning的方式计算Q值,再根据任务相似度采样轨迹和对应的 阅读全文
posted @ 2024-04-24 13:48 initial_h 阅读(53) 评论(0) 推荐(0) 编辑