02 2025 档案

transformer简介

摘要：Transformer 是一种用于自然语言处理（NLP）和深度学习的神经网络架构，最早由 Google 研究团队在 2017 年的论文 “Attention Is All You Need” 中提出。它彻底改变了 NLP 领域，并成为现代大模型（如 GPT、BERT、DeepSeek 等）的基础阅读全文

posted @ 2025-02-20 18:59 matengfei 阅读(8) 评论(0) 推荐(0) 编辑

大模型入门科普

摘要：什么是大模型？大模型，英文名叫Large Model，大型模型。早期的时候，也叫Foundation Model，基础模型。大模型是一个简称。完整的叫法，应该是“人工智能预训练大模型”。预训练，是一项技术，我们后面再解释。我们现在口头上常说的大模型，实际上特指大模型的其中一类，也是用得最多的一阅读全文

posted @ 2025-02-10 16:24 matengfei 阅读(53) 评论(0) 推荐(0) 编辑

公告

昵称： matengfei
园龄： 7年10个月
粉丝： 13
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

matengfei

02 2025 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论