摘要: Attention https://arxiv.org/pdf/1706.03762.pdf 网上博客很多,但讲Attention有两个版本 Q、K、V结构。https://www.cnblogs.com/cx2016/p/12800385.html 从注意力机制开始讲。比如《深度学习》 《动手学深 阅读全文
posted @ 2020-11-01 15:45 wa007 阅读(105) 评论(0) 推荐(0) 编辑