随笔分类 - Transformer学习笔记
摘要:1.模型整体架构 左图为论文作者提出了用于视频分类的架构,基于纯transformer的,右图为用不同方式处理时空特征的Encoder的不同组件的变体。 2.视频特征及token构建 2.1 Uniform frame sampling 这种方法就是如图所示,均匀间隔固定的帧,采样帧信息,按照Vit
阅读全文
摘要:1.加载 tokenizer是进行语言处理的基础,transformer实现分词器的基类是 tokenizer = AutoTokenizer.from_pretrained(tokenizer_type) 后面可以通过from_pretrained函数中的retrained_model_name_
阅读全文