02 2025 档案
摘要:Transformer 是一种用于 自然语言处理(NLP)和深度学习 的神经网络架构,最早由 Google 研究团队在 2017 年的论文 “Attention Is All You Need” 中提出。它彻底改变了 NLP 领域,并成为现代大模型(如 GPT、BERT、DeepSeek 等)的基础
阅读全文
摘要:什么是大模型? 大模型,英文名叫Large Model,大型模型。早期的时候,也叫Foundation Model,基础模型。 大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。 我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一
阅读全文