2021 年 11月 23 日随笔档案 - xingye_z

2021年11月23日

摘要：参考自李宏毅老师的self-atention的课程 pd下载：self-atention、Transformer 理论说明在NLP中，常用的计算两个向量之间相关性的方法有以下两种： self-attention中用的就是左侧的类型，将两个向量乘以一个可训练权重，然后将结构进行对应相乘，得到最终的相阅读全文

posted @ 2021-11-23 18:21 xingye_z 阅读(792) 评论(0) 推荐(0) 编辑

公告