2023 年 10月 23 日随笔档案 - MKT-porter

2023年10月23日

摘要： ViT｜ Vision Transformer ｜理论 + 代码_哔哩哔哩_bilibili 课件地址 https://65d8gk.axshare.com/?id=hk98lb&p=%E7%BD%91%E7%BB%9C%E7%BB%93%E6%9E%84&g=1&sc=3 1 不用卷积神经网络那些阅读全文

posted @ 2023-10-23 17:42 MKT-porter 阅读(35) 评论(0) 推荐(0) 编辑

pytorch(11.1) Transformer 传统翻译架构

摘要：官方 https://jalammar.github.io/illustrated-transformer/ 知乎解读 https://zhuanlan.zhihu.com/p/266069794 解码器中的自关注层的运行方式与编码器中的运行方式略有不同：在解码器中，自注意力层只允许关注输出序列中阅读全文

posted @ 2023-10-23 16:52 MKT-porter 阅读(30) 评论(0) 推荐(0) 编辑

pytorch(10.3) 多头注意

摘要： 10.5. 多头注意力 — 动手学深度学习 2.0.0 documentation (d2l.ai) Multi-Head Attention | 算法 + 代码_哔哩哔哩_bilibili 代码实现 x[1,4,2] 1几个样本（句子） 4 预测步长（4个单词） 2每个单词的编码后特征长度 fro 阅读全文

posted @ 2023-10-23 16:02 MKT-porter 阅读(19) 评论(0) 推荐(0) 编辑