Fork me on GitHub
摘要: RAG 幻觉检测方法 未经检查的幻觉在今天的检索增强生成应用中仍然是一个大问题。本研究评估了 4 个公共 RAG 数据集中流行的幻觉检测器。使用 AUROC 和精度/召回率,我们报告了 G-eval、Ragas 和可信语言模型等方法如何能够自动标记不正确的 LLM 响应。 利用各种幻觉检测方法识别 阅读全文
posted @ 2024-09-13 21:37 石头木 阅读(83) 评论(0) 推荐(0) 编辑