摘要: 1. ELMO 2. BERT 就是Transformer的Encoder部分:输入input,输出embedding 如果处理中文,用 字 作为单位 (潮水--词,潮--字) 2.1 预测Masked word 2.2 [SEP] 和 [CLS] [SEP]:两个句子的 边界 [CLS]:输出 分 阅读全文
posted @ 2020-08-22 16:00 douzujun 阅读(382) 评论(0) 推荐(0) 编辑