2024-02-04-大模型微调实战之chatglm全系解析 -卢菁

2024-02-04 周日老家阴

小记: 昨天大扫除，搞到灰头土脸，今天乖乖的学习大模型。

关键点: 国内大模型三大流派

得益于 ChatGLM2 的升级，CodeGeeX 不仅可以更好的支持中英文输入，以及最大的8192序列长度，并且各项性能指标也取得了大幅提升。

心得: 大模型绝对说不上百花齐放，根源还是基础模型提供的原始能力，很多公司基于基础大模型结合垂直业务领域进行训练从而获得的模型能力，主导者还是少数派的，普通人也是可以进行模型训练的，玩噱头的人都很聪明的，但是沉下心来进行研究的却是最难得的。

posted @ 2024-02-04 12:40 流雨声阅读(149) 评论(0) 编辑收藏举报

刷新页面返回顶部

流雨声