随笔分类 - 模型测试
模型测试领域
摘要:大模型评测探索 一、简介:大模型评测方法对比,对比传统的机器学习、深度学习与大模型测试过程,分析大模型评测体系。 二、以前的评价(机器学习、深度学习) 评价分散:以前标准能力评价往往较为零散,每个能力有各自的评价,局限在下游任务,比如图像识别:准确率、精准率、召回率,文本分类:Micro,推荐系统:
阅读全文
摘要:《A Survey on Evaluation of Large Language Models》 一、论文介绍:微软亚洲研究院公开了介绍大模型评测领域的论文《A Survey on Evaluation of Large Language Models》。该论文一共调研了219篇文献,以评测内容
阅读全文
摘要:SuperCLUE评测报告分享-数据时间2023.11月 一、行业发展:自2022年11月30日ChatGPT发布以来,AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。国内学术和产业界在过去一年也有了实质性的突破。 大致可以分为三个阶段,即准备期(ChatGPT发布后国内产学研迅速形成大
阅读全文
摘要:一、图书简介:本书是一本全面的指南,介绍了各种 Prompt 技术的理解和利用,用于从 ChatGPT中生成高质量的答案。 我们将探讨如何使用不同的 Prompt 工程技术来实现不同的目标。ChatGPT 是一 种先进的语言模型,能够生成类似人类的文本。然而,了解正确的提问方式以获 取我们所需的高质
阅读全文