02 2025 档案

摘要:Transformer 是一种用于 自然语言处理(NLP)和深度学习 的神经网络架构,最早由 Google 研究团队在 2017 年的论文 “Attention Is All You Need” 中提出。它彻底改变了 NLP 领域,并成为现代大模型(如 GPT、BERT、DeepSeek 等)的基础 阅读全文
posted @ 2025-02-20 18:59 matengfei 阅读(8) 评论(0) 推荐(0) 编辑
摘要:什么是大模型? 大模型,英文名叫Large Model,大型模型。早期的时候,也叫Foundation Model,基础模型。 大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。 我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一 阅读全文
posted @ 2025-02-10 16:24 matengfei 阅读(53) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示