会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
xd_xumaomao
博客园
首页
新随笔
联系
管理
订阅
2023年12月26日
GPT-3《Language Models are Few-Shot Learners》解读
摘要: GPT-3 和 GPT-2差别 1. 效果上,超出 GPT-2 非常多,能生成人类难以区分的新闻文章;2. 主推 few-shot,相比于 GPT-2 的 zero-shot,具有很强的创新性;3. 模型结构略微变化,采用 sparse attention 模块;4. 海量训练语料 45TB(清洗后
阅读全文
posted @ 2023-12-26 16:28 xd_xumaomao
阅读(86)
评论(0)
推荐(0)
编辑
公告