ChatGPT背后的算法——RLHF总结
摘要:
ChatGPT背后的算法——RLHF总结 参考链接:抱抱脸:ChatGPT背后的算法——RLHF | 附12篇RLHF必刷论文 (qq.com) 背景 (文本生成的语言模型评价不在训练中) chatGPT训练4步骤 1 预训练 [prompt, text] 无监督, 数据语料来源可能都是 爬虫web 阅读全文
posted @ 2023-03-19 19:01 lexn 阅读(177) 评论(0) 推荐(0) 编辑