InternLM第三期实战-进阶第一关

探索 InternLM 模型能力边界

测试地址：https://opencompass.org.cn/arena

在 CompassArena 中选择双模型对话，使用InternLM2.5及另外任意其他模型对话。

此次选择的两个模型分别是InternLM2.5-chat-7B和Qwen1.5-7B-chat

bad case

eg.1

Qwen解释的更清晰，输出格式也更好

eg.2

简单的逻辑题

eg.3

InretnLM没有回答到重点

eg.4

不知道为啥InternLM的公式输出格式不太对

good case

eg.1

InternLM的输出更具有条理性

eg.2

InternLM解释得更完整

eg.3

同样这个回答完整性更好

eg.4

InternLM的回答是可行方案

eg.5

纯主观，InternLM更好

posted @ 2024-08-29 19:34 柠檬戚风阅读(17) 评论(0) 收藏举报

刷新页面返回顶部