11 2024 档案
摘要:核心内容来自《大模型安全研究报告(2024年).pdf》 更多的安全内容见内部“语雀-大模型”-笔记 真实性:训练数据能真实反映物理世界客观规律和人类社会实际运转情况的性质。 多样性:训练数据应覆盖尽可能多的样本,以确保大模型能对不同情况进行泛化的性质。 准确性:针对所规定的各项安全要求 , 大模型
阅读全文
摘要:数字菁英 地址:https://www.digitalelite.cn/
阅读全文
摘要:一、大模型综合评价标准 来源:https://mp.weixin.qq.com/s/MbeC0rYpE4COB52Cb417FA 大模型综合评价标准,是用于全面评估语言模型性能和实际应用能力的多维度指标体系。包括语言生成质量、任务性能、模型效率等。这些标准可以系统地衡量模型在不同方面的表现,确保其在
阅读全文
摘要:准确率(Accuracy) 准确率(Accuracy)是用来评估分类模型性能的一个重要指标。它表示模型正确预测的样本数占总样本数的比例。 准确率的计算公式为: Accuracy=(TP+TN)/(TP+TN+FP+FN) 其中: TP(True Positives):真正例,模型正确预测为正类的样本
阅读全文