InternLM第三期实战-进阶第一关
探索 InternLM 模型能力边界
测试地址:https://opencompass.org.cn/arena
在 CompassArena 中选择双模型对话,使用InternLM2.5及另外任意其他模型对话。
此次选择的两个模型分别是InternLM2.5-chat-7B和Qwen1.5-7B-chat
bad case
eg.1
Qwen解释的更清晰,输出格式也更好

eg.2
简单的逻辑题

eg.3
InretnLM没有回答到重点

eg.4
不知道为啥InternLM的公式输出格式不太对

good case
eg.1
InternLM的输出更具有条理性

eg.2
InternLM解释得更完整

eg.3
同样这个回答完整性更好

eg.4
InternLM的回答是可行方案

eg.5
纯主观,InternLM更好


浙公网安备 33010602011771号