mendge

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

最近在使用chatgpt帮助学习英语,主要是进行语法分析和难点解释。为了找到最适合的模型,我比较了多个模型的回答。

语法分析问题

image

这是我在实际中理解有困难的句子,尽管比较简短,但从内容上理解,它涉及了倒装。

各个模型回答

image

  • gpt-3.- 5-turbo-1106 是经过微调的 3.5-turbo

  • gpt-4o-mini-2024-07-18 是最新版的 4o-mini

  • gpt-4o-2024-05-13 是最新版的 4o

前两者的回答比较短,4o 的回答明显更好一点,但是并没有分析出倒装。

image

4-turbo 和 4-preview 类的模型均理解出了倒装,整体的回答也很理想

image

这里出场的是纯正的 gpt-4 和 其最新版本,其价格是 4-turbo 和 4-preview 类的 3 倍,按理说应该得出更好的答案,但是均没有理解出倒装,而且纯正的 gpt-4 好像有偷懒的问题。

简单总结

虽然这里的测试样本只有一个,但是结合我日常的使用情况来看,4-turbo 和 4-preview 类模型确实更加适合分析英语gpt-4 则适合关于逻辑的问题,而且,问题越复杂他表现于其他模型就更为出色。

posted on 2024-08-10 19:07  mendge01  阅读(19)  评论(0编辑  收藏  举报