摘要: 自注意机制 1. 自注意机制的特点 考虑这样一个问题,输入长度为m的序列\(\{x_1, x_2,...,x_m\}\),序列中的元素都是向量,要求输出长度同样为m的序列\(\{c_1, c_2,...,c_m\}\),另外还有两个要求: 序列的长度m是不确定的,可以动态变化,但是神经网络的参数数量 阅读全文
posted @ 2024-09-21 11:44 吃瓜的哲学 阅读(66) 评论(0) 推荐(0) 编辑