摘要:
大模型评估指标 1.基础评估指标 参考klu.ai和Microsoft.com的评估指标列表如下:https://klu.ai/glossary/llm-evaluation 类别 度量 描述 用户参与度和效用指标 访问 访问LLM应用程序功能的用户数 提交 提交提示词的用户数 响应 LLM应用程序 阅读全文
摘要:
大语言模型(LLM)评价指标小汇总(也许会更新) from:https://zhuanlan.zhihu.com/p/641416694 目录 总之就是接了个小项目,这些天统计了一些LLM评价指标,不算很全面,很多方法的具体操作都不是很熟悉,参考论文也没找全,大家就凑合着看: 1. 榜单、论文统 阅读全文