会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
xd_xumaomao
博客园
首页
新随笔
联系
管理
订阅
2023年12月27日
InstructGPT《InstructGPT: Training language models to follow instructions with human feedback》解读
摘要: 背景 GPT-3 虽然在各大 NLP 任务以及文本生成的能力上令人惊艳,但是他仍然还是会生成一些带有偏见的,不真实的,有害的造成负面社会影响的信息,而且很多时候,他并不按人类喜欢的表达方式去说话。在这个背景下,OpenAI 提出了一个概念“Alignment”,意思是模型输出与人类真实意图对齐,符合
阅读全文
posted @ 2023-12-27 20:48 xd_xumaomao
阅读(60)
评论(0)
推荐(0)
编辑
公告