2023年3月19日

ChatGPT背后的算法——RLHF总结

摘要: ChatGPT背后的算法——RLHF总结 参考链接:抱抱脸:ChatGPT背后的算法——RLHF | 附12篇RLHF必刷论文 (qq.com) 背景 (文本生成的语言模型评价不在训练中) chatGPT训练4步骤 1 预训练 [prompt, text] 无监督, 数据语料来源可能都是 爬虫web 阅读全文

posted @ 2023-03-19 19:01 lexn 阅读(167) 评论(0) 推荐(0) 编辑

导航