10 2023 档案

大模型面试问题总结
摘要:1)大模型问什么都使用decoder-only a)工程上应用上方便处理多轮对话; b)在没有微调的情况下,其更容易处理zero-shot generation; c)encoder-decoder在微调之后效果优于decoder-only,但是参数量巨大,考虑到性能和计算资源上的消耗更少; d)e 阅读全文

posted @ 2023-10-29 19:35 limingqi 阅读(865) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示