摘要: 最近一直在看有关transformer相关网络结构,为此我特意将经典结构 Attention is all you need 论文进行了解读,并根据其源码深入解读attntion经典结构, 为此本博客将介绍如下内容: 论文链接:https://arxiv.org/abs/1706.03762 一.T 阅读全文
posted @ 2021-12-11 00:41 tangjunjun 阅读(1772) 评论(0) 推荐(0) 编辑
https://rpc.cnblogs.com/metaweblog/tangjunjun