摘要:
六大策略助你获得更优结果 1. 清晰明确的指令 请记住,模型无法直接读取你的想法。如果输出结果太长,请要求简短回复;如果输出结果过于简单,请要求专家级别的写作;如果你不喜欢当前的格式,请提供你想要的格式示例。模型需要猜测的东西越少,就越有可能生成你期望的结果。 策略: 在你的查询中提供更多细节,以便 阅读全文
摘要:
核心内容来自《大模型安全研究报告(2024年).pdf》 更多的安全内容见内部“语雀-大模型”-笔记 真实性:训练数据能真实反映物理世界客观规律和人类社会实际运转情况的性质。 多样性:训练数据应覆盖尽可能多的样本,以确保大模型能对不同情况进行泛化的性质。 准确性:针对所规定的各项安全要求 , 大模型 阅读全文
摘要:
数字菁英 地址:https://www.digitalelite.cn/ 阅读全文
摘要:
一、大模型综合评价标准 来源:https://mp.weixin.qq.com/s/MbeC0rYpE4COB52Cb417FA 大模型综合评价标准,是用于全面评估语言模型性能和实际应用能力的多维度指标体系。包括语言生成质量、任务性能、模型效率等。这些标准可以系统地衡量模型在不同方面的表现,确保其在 阅读全文
摘要:
准确率(Accuracy) 准确率(Accuracy)是用来评估分类模型性能的一个重要指标。它表示模型正确预测的样本数占总样本数的比例。 准确率的计算公式为: Accuracy=(TP+TN)/(TP+TN+FP+FN) 其中: TP(True Positives):真正例,模型正确预测为正类的样本 阅读全文
摘要:
附件 阅读全文
摘要:
网站(要FQ才可查看) 网站:https://llmbench.ai/agent github地址:https://github.com/THUDM/AlignBench/blame/master/data/data_v1.1_release.jsonl 主要评测内容 评测数据样例: 评测基准背景 阅读全文