随笔- 52 文章- 0 评论- 9 阅读- 87153

随笔分类 - 模型测试

模型测试领域

摘要：大模型评测探索一、简介：大模型评测方法对比，对比传统的机器学习、深度学习与大模型测试过程，分析大模型评测体系。二、以前的评价（机器学习、深度学习）评价分散：以前标准能力评价往往较为零散，每个能力有各自的评价，局限在下游任务，比如图像识别：准确率、精准率、召回率，文本分类：Micro,推荐系统：阅读全文

posted @ 2024-01-02 15:59 岁月如歌_九阅读(212) 评论(1) 推荐(0) 编辑

大模型评测-微软亚洲研究院：A Survey on Evaluation of Large Language Models论文分享

摘要：《A Survey on Evaluation of Large Language Models》一、论文介绍：微软亚洲研究院公开了介绍大模型评测领域的论文《A Survey on Evaluation of Large Language Models》。该论文一共调研了219篇文献，以评测内容阅读全文

posted @ 2024-01-02 15:49 岁月如歌_九阅读(238) 评论(0) 推荐(0) 编辑

中文大模型基准测试报告--SuperCLUE评测报告分享

摘要：SuperCLUE评测报告分享-数据时间2023.11月一、行业发展：自2022年11月30日ChatGPT发布以来，AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。国内学术和产业界在过去一年也有了实质性的突破。大致可以分为三个阶段，即准备期（ChatGPT发布后国内产学研迅速形成大阅读全文

posted @ 2024-01-02 15:43 岁月如歌_九阅读(212) 评论(0) 推荐(0) 编辑

ChatGPT高质量prompt技巧指南-《向 ChatGPT 提问获取高质量答案的艺术：Prompt 工程技术完全指南》图书分享

摘要：一、图书简介：本书是一本全面的指南，介绍了各种 Prompt 技术的理解和利用，用于从 ChatGPT中生成高质量的答案。我们将探讨如何使用不同的 Prompt 工程技术来实现不同的目标。ChatGPT 是一种先进的语言模型，能够生成类似人类的文本。然而，了解正确的提问方式以获取我们所需的高质阅读全文

posted @ 2024-01-02 15:36 岁月如歌_九阅读(133) 评论(2) 推荐(0) 编辑

公告

昵称：岁月如歌_九
园龄： 6年7个月
粉丝： 17
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

合集

大模型测试(1)

岁月如歌_九

随笔分类 - 模型测试

公告

搜索

常用链接

我的标签

合集

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论