摘要: 参考自李宏毅老师的self-atention的课程 pd下载:self-atention、Transformer 理论说明 在NLP中,常用的计算两个向量之间相关性的方法有以下两种: self-attention中用的就是左侧的类型,将两个向量乘以一个可训练权重,然后将结构进行对应相乘,得到最终的相 阅读全文
posted @ 2021-11-23 18:21 xingye_z 阅读(792) 评论(0) 推荐(0) 编辑