摘要: mobilenet v1:深度可分离卷积 depthwise separable convolution 首先利用3×3的深度可分离卷积提取特征,然后利用1×1的卷积来扩张通道。用这样的block堆叠起来的MobileNetV1既能较少不小的参数量、计算量,提高网络运算速度,又能的得到一个接近于标准 阅读全文
posted @ 2020-07-07 16:27 _thousfeet 阅读(1047) 评论(0) 推荐(0) 编辑
摘要: 数据集分为raw和tokenized版本,应该使用raw版本用Bert自带的encode方法进行分词(因为Bert有自己的词表并且使用bpe的方法避免oov) 分词前的raw data长这样: 用tokenizer encode之后再convert_ids_to_tokens打出来看看长这样: en 阅读全文
posted @ 2020-07-07 16:25 _thousfeet 阅读(777) 评论(0) 推荐(0) 编辑
摘要: There are multi-grained semantic units in natural languages such as word, phrase, sentence, document. We have seen how to learn a word representation 阅读全文
posted @ 2020-06-19 10:19 _thousfeet 阅读(295) 评论(0) 推荐(0) 编辑
摘要: Word representation is a process that transform the symbols to the machine understandable meanings. The goals of Word Representation are Compute word 阅读全文
posted @ 2020-06-19 10:03 _thousfeet 阅读(392) 评论(0) 推荐(0) 编辑