Syw_文 - 博客园

2024年11月18日

摘要：核心内容来自《大模型安全研究报告（2024年）.pdf》更多的安全内容见内部“语雀-大模型”-笔记真实性：训练数据能真实反映物理世界客观规律和人类社会实际运转情况的性质。多样性：训练数据应覆盖尽可能多的样本，以确保大模型能对不同情况进行泛化的性质。准确性：针对所规定的各项安全要求 , 大模型阅读全文

posted @ 2024-11-18 12:03 Syw_文阅读(6) 评论(0) 推荐(0) 编辑

2024年11月14日

【大模型】行业报告(免费）查询与下载地址总结

摘要：数字菁英地址：https://www.digitalelite.cn/ 阅读全文

posted @ 2024-11-14 15:19 Syw_文阅读(11) 评论(0) 推荐(0) 编辑

【大模型】大模型评价标准收集

摘要：一、大模型综合评价标准来源：https://mp.weixin.qq.com/s/MbeC0rYpE4COB52Cb417FA 大模型综合评价标准，是用于全面评估语言模型性能和实际应用能力的多维度指标体系。包括语言生成质量、任务性能、模型效率等。这些标准可以系统地衡量模型在不同方面的表现，确保其在阅读全文

posted @ 2024-11-14 15:06 Syw_文阅读(12) 评论(0) 推荐(0) 编辑

2024年11月13日

【大模型】评测指标解析（准确率/精确率/召回率/F1分数/rouge/Perplexity/BLEU）

摘要：准确率（Accuracy）准确率（Accuracy）是用来评估分类模型性能的一个重要指标。它表示模型正确预测的样本数占总样本数的比例。准确率的计算公式为： Accuracy=(TP+TN)/(TP+TN+FP+FN) 其中： TP（True Positives）：真正例，模型正确预测为正类的样本阅读全文

posted @ 2024-11-13 16:44 Syw_文阅读(66) 评论(0) 推荐(0) 编辑

【大模型评测】国内外主流评测基准分析(图）

摘要：附件阅读全文

posted @ 2024-11-13 15:50 Syw_文阅读(4) 评论(0) 推荐(0) 编辑

2024年7月29日

【大模型评测】AlignBench: 多维度中文对齐评测基准

摘要：网站（要FQ才可查看）网站：https://llmbench.ai/agent github地址：https://github.com/THUDM/AlignBench/blame/master/data/data_v1.1_release.jsonl 主要评测内容评测数据样例: 评测基准背景阅读全文

posted @ 2024-07-29 10:25 Syw_文阅读(61) 评论(0) 推荐(0) 编辑

2024年6月3日

质量管理实施方案

摘要：【人】核心：培养招聘优秀人才，打造质量团队定期专项分享，培训专业技能明确质量责任，强化质量导向【法】核心：标准明确质量目标，量化评价标准制定操作规范，统一执行标准监控过程质量，确保符合标准持续改进体系，优化质量标准【测】核心：评估强化测试环节，验证标准符合性严格质量监测，保障产阅读全文

posted @ 2024-06-03 10:48 Syw_文阅读(31) 评论(0) 推荐(0) 编辑

质量管理的重要性

摘要：阅读全文

posted @ 2024-06-03 10:18 Syw_文阅读(15) 评论(0) 推荐(0) 编辑

2023年12月21日

小红书营销文案标注要求

摘要：标注样例：阅读全文

posted @ 2023-12-21 15:53 Syw_文阅读(40) 评论(0) 推荐(0) 编辑

2023年12月12日

数据标注质量&算法效果评估的要点解读

摘要：算法质量保障要点解读算法质量保障流程数据标注事项 ● 明确数据标注目的和需求：如明确是训练模型、测试模型、评估模型等 ● 制定标注计划：范围、进度、人员、工具等 ● 选择合适的标注人员：专业知识、背景、能力等 ● 提供标注培训/指导：标注目的/需求的介绍、标注标准的讲解、标注方法的演示、练习 ● 阅读全文

posted @ 2023-12-12 16:08 Syw_文阅读(850) 评论(0) 推荐(1) 编辑

Syw

公告