摘要: Bert不完全手册3. Bert训练策略优化!RoBERTa & SpanBERT Bert提出了很好的双向LM训练和迁移框架,但它的训练方式槽点较多,这一章就训练方案改良,我们来聊聊RoBERTa和SpanBERT,看作者这两篇paper是一个组的作品,所以存在一些共同点~。正在施工中的代码库也接入了这两种模型作为backbone,同时支持半监督,领域迁移,降噪loss,蒸馏等模型优化项,感兴趣的戳这里>>SimpleClassification 阅读全文
posted @ 2022-03-22 10:18 风雨中的小七 阅读(1262) 评论(0) 推荐(0) 编辑