罗西的思考 - 博客园

2025年3月

探秘Transformer系列之（13）--- FFN

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-03-14 19:42 罗西的思考阅读(8443) 评论(0) 推荐(3)

探秘Transformer系列之（12）--- 多头自注意力

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-03-11 19:18 罗西的思考阅读(7045) 评论(5) 推荐(4)

探秘Transformer系列之（11）--- 掩码

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-03-08 10:18 罗西的思考阅读(7840) 评论(0) 推荐(2)

探秘Transformer系列之（10）--- 自注意力

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-03-05 20:37 罗西的思考阅读(4144) 评论(0) 推荐(2)

探秘Transformer系列之（9）--- 位置编码分类

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-03-03 20:48 罗西的思考阅读(3551) 评论(0) 推荐(0)

探秘Transformer之（8）--- 位置编码

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-03-01 14:33 罗西的思考阅读(5102) 评论(5) 推荐(5)

2025年2月

探秘Transformer系列之（7）--- embedding

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-27 20:32 罗西的思考阅读(6438) 评论(2) 推荐(5)

探秘Transformer系列之（6）--- token

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-24 20:02 罗西的思考阅读(3686) 评论(1) 推荐(1)

探秘Transformer系列之（5）--- 训练&推理

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-22 09:55 罗西的思考阅读(5283) 评论(4) 推荐(1)

探秘Transformer系列之（4）--- 编码器 & 解码器

摘要：从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。阅读全文

posted @ 2025-02-20 20:42 罗西的思考阅读(8067) 评论(7) 推荐(2)