2024 年 4月 24 日随笔档案 - initial_h

2024年4月24日

Large Language Models Are Semi-Parametric Reinforcement Learning Agents

摘要：发表时间： 2023 (NeurIPS 2023) 文章要点：文章提出一个evolvable LLM-based agent框架REMEMBERER，主要思路是给大模型加一个experience memory存储过去的经验，然后用Q-learning的方式计算Q值，再根据任务相似度采样轨迹和对应的阅读全文

posted @ 2024-04-24 13:48 initial_h 阅读(53) 评论(0) 推荐(0) 编辑

initial_h

https://github.com/initial-h

公告