摘要:
mobilenet v1:深度可分离卷积 depthwise separable convolution 首先利用3×3的深度可分离卷积提取特征,然后利用1×1的卷积来扩张通道。用这样的block堆叠起来的MobileNetV1既能较少不小的参数量、计算量,提高网络运算速度,又能的得到一个接近于标准 阅读全文
摘要:
数据集分为raw和tokenized版本,应该使用raw版本用Bert自带的encode方法进行分词(因为Bert有自己的词表并且使用bpe的方法避免oov) 分词前的raw data长这样: 用tokenizer encode之后再convert_ids_to_tokens打出来看看长这样: en 阅读全文