2024 年 8月 6 日随笔档案 - 老张哈哈哈

2024年8月6日

摘要：在Transformer模型中，位置编码（Positional Encoding）的引入是为了补充自注意力机制（Self-Attention）在捕捉序列位置信息方面的不足。自注意力机制是Transformer的核心，但它对输入序列的位置信息并不敏感。具体来说，Transformer模型对输入序列中的阅读全文

posted @ 2024-08-06 18:44 老张哈哈哈阅读(1064) 评论(0) 推荐(0) 编辑

公告