Loading

摘要: 1- Transformer模型是什么 Transformer模型是一个基于多头自注意力的序列到序列模型(seq2seq model),整个网络结构可以分为编码器(encoder)和解码器(decoder)两部分。seq2seq模型输出序列的长度是不确定的。我们输入一个sequence后,先由enc 阅读全文
posted @ 2023-10-23 18:49 mostimali 阅读(55) 评论(0) 推荐(0) 编辑