摘要:
核心内容来自《大模型安全研究报告(2024年).pdf》 更多的安全内容见内部“语雀-大模型”-笔记 真实性:训练数据能真实反映物理世界客观规律和人类社会实际运转情况的性质。 多样性:训练数据应覆盖尽可能多的样本,以确保大模型能对不同情况进行泛化的性质。 准确性:针对所规定的各项安全要求 , 大模型 阅读全文
摘要:
数字菁英 地址:https://www.digitalelite.cn/ 阅读全文
摘要:
一、大模型综合评价标准 来源:https://mp.weixin.qq.com/s/MbeC0rYpE4COB52Cb417FA 大模型综合评价标准,是用于全面评估语言模型性能和实际应用能力的多维度指标体系。包括语言生成质量、任务性能、模型效率等。这些标准可以系统地衡量模型在不同方面的表现,确保其在 阅读全文
摘要:
准确率(Accuracy) 准确率(Accuracy)是用来评估分类模型性能的一个重要指标。它表示模型正确预测的样本数占总样本数的比例。 准确率的计算公式为: Accuracy=(TP+TN)/(TP+TN+FP+FN) 其中: TP(True Positives):真正例,模型正确预测为正类的样本 阅读全文
摘要:
附件 阅读全文
摘要:
网站(要FQ才可查看) 网站:https://llmbench.ai/agent github地址:https://github.com/THUDM/AlignBench/blame/master/data/data_v1.1_release.jsonl 主要评测内容 评测数据样例: 评测基准背景 阅读全文
摘要:
【人】核心:培养 招聘优秀人才,打造质量团队 定期专项分享,培训专业技能 明确质量责任,强化质量导向 【法】核心:标准 明确质量目标,量化评价标准 制定操作规范,统一执行标准 监控过程质量,确保符合标准 持续改进体系,优化质量标准 【测】核心:评估 强化测试环节,验证标准符合性 严格质量监测,保障产 阅读全文
摘要:
阅读全文
摘要:
算法质量保障要点解读 算法质量保障流程 数据标注事项 ● 明确数据标注目的和需求:如明确是训练模型、测试模型、评估模型等 ● 制定标注计划:范围、进度、人员、工具等 ● 选择合适的标注人员:专业知识、背景、能力等 ● 提供标注培训/指导:标注目的/需求的介绍、标注标准的讲解、标注方法的演示、练习 ● 阅读全文