InternLM第三期实战-进阶第一关

探索 InternLM 模型能力边界

测试地址:https://opencompass.org.cn/arena

CompassArena 中选择双模型对话,使用InternLM2.5及另外任意其他模型对话。

此次选择的两个模型分别是InternLM2.5-chat-7BQwen1.5-7B-chat

bad case

eg.1

Qwen解释的更清晰,输出格式也更好

image

eg.2

简单的逻辑题
image

eg.3

InretnLM没有回答到重点

image

eg.4

不知道为啥InternLM的公式输出格式不太对

image

good case

eg.1

InternLM的输出更具有条理性

image

eg.2

InternLM解释得更完整

image

eg.3

同样这个回答完整性更好

image

eg.4

InternLM的回答是可行方案

image

eg.5

纯主观,InternLM更好

image

posted @ 2024-08-29 19:34  柠檬戚风  阅读(17)  评论(0)    收藏  举报