2025 年 2月 8 日随笔档案 - wanghoney

2025年2月8日

摘要：（一）Transformer模型架构 2017 年，Transformer模型使用Self-Attention结构取代了在NLP任务中常用的RNN网络结构。相比RNN网络结构，其最大的优点是可以并行计算。 Transformer的整体模型架构如图所示： Transformer模型架构（二）Tran 阅读全文

posted @ 2025-02-08 15:50 wanghoney 阅读(33) 评论(0) 推荐(0)

第一章 GPT-4o模型概述

摘要：介绍： GPT-4o是OpenAI推出的首个原生多模态模型，能够处理文本、视觉和音频输入，并生成相应的多模态输出。工作原理： 1）架构 GPT-4o采用多层变换器（Transformer）架构，基于注意力机制（Attention Mechanism）实现高效的语言处理。 2）端到端训练 GPT-4 阅读全文

posted @ 2025-02-08 15:16 wanghoney 阅读(587) 评论(0) 推荐(0)