摘要: 解密Prompt45. 再探LLM Scalable Oversight -辩论、博弈哪家强 以上两个方向相对正交分别从Verifier和Generator两个方去尝试解决Scalable Oversight的问题,今天再聊一个相对Hybrid的方向,通过Verifier和Generator相互博弈来同时提升双方实力。这里分别介绍Anthropic的辩论法,和OpenAI的博弈法 阅读全文
posted @ 2024-12-30 08:31 风雨中的小七 阅读(289) 评论(0) 推荐(0)