摘要: 一、模型框架图 二、分层介绍 1)ALBERT层 albert是以单个汉字作为输入的(本次配置最大为128个,短句做padding),两边分别加上开始标识CLS和结束标识SEP,输出的是每个输入word的embedding。在该框架中其实主要就是利用了预训练模型albert的词嵌入功能,在此基础上f 阅读全文
posted @ 2019-12-15 18:34 光彩照人 阅读(3262) 评论(0) 推荐(0) 编辑