摘要: 今天起会一一更新 transformer BERT ,transformer XL XLNET的对应笔记 import torch def padding_mask(seq, pad_idx): return (seq != pad_idx).unsqueeze(-2) # [B, 1, L] de 阅读全文
posted @ 2021-07-11 21:03 彩印网 阅读(38) 评论(0) 推荐(0) 编辑