2023 年 12月 27 日随笔档案 - xd_xumaomao

2023年12月27日

InstructGPT《InstructGPT: Training language models to follow instructions with human feedback》解读

摘要：背景 GPT-3 虽然在各大 NLP 任务以及文本生成的能力上令人惊艳，但是他仍然还是会生成一些带有偏见的，不真实的，有害的造成负面社会影响的信息，而且很多时候，他并不按人类喜欢的表达方式去说话。在这个背景下，OpenAI 提出了一个概念“Alignment”，意思是模型输出与人类真实意图对齐，符合阅读全文

posted @ 2023-12-27 20:48 xd_xumaomao 阅读(60) 评论(0) 推荐(0) 编辑

xd_xumaomao

公告