2024 年 3月 26 日随笔档案 - 白鹿原老张

2024年3月26日

摘要：原作：Jason Wei 引言：此博客文章不代表我的雇主OpenAI的立场（过去、现在或未来）。 /Gemini翻译/ 我将回顾在讨论大型语言模型的涌现能力时出现的一些常见论点。去年，我们撰写了一篇立场文件，将涌现能力定义为“小语言模型中不存在但在大语言模型中存在的能力”。我表明了涌现能力广泛存在，阅读全文

posted @ 2024-03-26 12:22 白鹿原老张阅读(66) 评论(0) 推荐(0) 编辑

【译】关于大语言模型的一些直觉

摘要：原作：jasonwei，引言：如今，一个悬而未决的问题是，为什么大型语言模型如此有效。在这篇博文中，我将讨论有关大型语言模型的六个基本直觉。其中许多直觉受到手动检查数据的启发，这是一项我发现有帮助且会推荐的练习。语言模型经过预训练，可以简单地预测文本语料库中的下一个单词，并且它们由此学到了惊人的阅读全文

posted @ 2024-03-26 11:06 白鹿原老张阅读(67) 评论(0) 推荐(0) 编辑

好好学习，天天向上

读无字之书,品惊人妙句,会难通之解,参最上禅机