摘要:
BERT模型中的特殊标记(Special Tokens)。它们的含义如下: [PAD]:在batch中对齐序列长度时,用 [PAD]进行填充以使所有序列长度相同。可以通过将其添加到较短的序列末尾来实现对齐。[CLS]:在输入序列的开头添加 [CLS] 标记,以表示该序列的分类结果。[SEP]:用于分 阅读全文
摘要:
nn.LSTM模块参数 input_size :输入的维度 hidden_size:h的维度 num_layers:堆叠LSTM的层数,默认值为1 bias:偏置 ,默认值:True batch_first: 如果是True,则input为(batch, seq, input_size)。默认值为: 阅读全文