摘要: GPT-3 和 GPT-2差别 1. 效果上,超出 GPT-2 非常多,能生成人类难以区分的新闻文章;2. 主推 few-shot,相比于 GPT-2 的 zero-shot,具有很强的创新性;3. 模型结构略微变化,采用 sparse attention 模块;4. 海量训练语料 45TB(清洗后 阅读全文
posted @ 2023-12-26 16:28 xd_xumaomao 阅读(86) 评论(0) 推荐(0) 编辑