2024 年 7月 3 日随笔档案 - 蝈蝈俊

2024年7月3日

从GPT-1看Transformer的崛起

摘要：要深入理解大语言模型（LLM）的内部工作机制，不妨先从GPT-1模型开始。我们主要从发展历程、意义、论文中的架构图来展开。一、发展历程 2017年，Google推出了Transformer模型，这一架构因其在性能上的显著优势迅速吸引了OpenAI团队的注意。《Attention Is All 阅读全文

posted @ 2024-07-03 20:50 蝈蝈俊阅读(20) 评论(0) 推荐(0) 编辑

蝈蝈俊的技术心得

导航

公告

从GPT-1看Transformer的崛起