摘要:《Align before Fuse: Vision and Language Representation Learning with Momentum Distillation》 引言 VLP目标是从大规模图片-文本对子中学习到多模态表示,一次改进下游的视觉-语言任务。 VLP框架的局限性如下:
阅读全文
摘要:Transofrmer翻译任务的工作流程 注意力Pad掩码的获得 因为输入句子需要统一长度,肯定会填充Pad特殊字符,Pad特殊字符在word embedding中的数值为0。 提前生成好注意力机制中Pad的掩码。 假设句子长度为Len,那就生成一个Len x Len 矩阵,将其Pad位置,也就是输
阅读全文
摘要:Keras版本 导入模块 from keras.datasets import cifar10 import numpy as np from keras.utils import np_utils import matplotlib.pyplot as plt from keras.models
阅读全文
摘要:MNIST数据集合 MNIST数据集共有训练数据60 000项,测试数据10 000项,每一项都是由images和label组成。图像大小都是28 x 28。 数据预处理 导入需要的模块 import numpy as np import pandas as pd from keras.utils
阅读全文