摘要: JudgeLM: Fine-tuned Large Language Models are Scalable Judges 由于现有基准和指标的限制,在开放式环境中评估大型语言模型(llm)是一项具有挑战性的任务。为了克服这一挑战,本文引入了微调llm作为可扩展“法官”的概念,称为JudgeLM,这 阅读全文
posted @ 2023-11-03 09:46 deephub 阅读(14) 评论(0) 推荐(0) 编辑