摘要: Transformer中主要运用Query、Key和Value三个矩阵 想象这是一个相亲画面,我有我心中有个喜欢女孩的样子,我会按照这个心目中的形象浏览各个女孩的照片,如果一个女生的样貌很想我心中的样子,我就会注意到这个人,并安排一段稍微长一点的时间阅读她的详细资料,反之我就会安排少一点时间看的材料 阅读全文
posted @ 2020-09-23 17:01 江湖小菜鸡 阅读(514) 评论(0) 推荐(0) 编辑
摘要: Encoder可以看作是自重压缩器,去繁从简,将最有用的特征给识别出来,用最简练的信息表达他们。 Decoder是解码器,但是并不是单纯的将压缩好的信息还原,而是将压缩好的信息解压成另外一种形式的信息。 阅读全文
posted @ 2020-09-23 12:30 江湖小菜鸡 阅读(665) 评论(1) 推荐(0) 编辑