摘要: 链接:https://ac.nowcoder.com/acm/contest/64384/C 来源:牛客网 超市里一共有 \(n\) 个货架,\(m\) 个商品,一开始商品的位置是被打乱的,小Why需要将商品全部归位。 小Why在给货架编号后,实现了每个商品所在货架必然在其应在货架之前。 小Why决 阅读全文
posted @ 2023-09-20 17:34 lipu123 阅读(71) 评论(0) 推荐(0) 编辑
摘要: 1.Cross self attention 1. 第一个就是这个地方,我们将编码器的输出看成key和value,然后将第一个多头注意力层输出的值看成query.其实这里可以看成Cross Attention,而不是self Attention。Cross Attention会用解码器生成的q来查询 阅读全文
posted @ 2023-09-20 16:49 lipu123 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 1.Input Embedding 就是将输入的句子给映射成向量。 2.加入位置编码 对于每个奇数时间步,使用余弦函数创建一个向量。对于每个偶数时间步,使用正弦函数创建一个向量。然后将这些向量添加到相应的嵌入向量。 因为Transformer没有像RNN一样的递归,所以我们必须将位置信息添加到输入嵌 阅读全文
posted @ 2023-09-20 11:58 lipu123 阅读(420) 评论(0) 推荐(0) 编辑