2024 年 9月 20 日随笔档案 - deephub

2024年9月20日

摘要：在当前大语言模型(LLM)应用开发的背景下,一个关键问题是如何评估模型输出的准确性。我们需要确定哪些评估指标能够有效衡量提示(prompt)的效果,以及在多大程度上需要对提示进行优化。为解决这一问题,我们将介绍一个基于双代理的RAG(检索增强生成)评估系统。该系统使用生成代理和反馈代理,基于预定义阅读全文

posted @ 2024-09-20 16:42 deephub 阅读(12) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

公告