yangyang12138

导航

2020年5月17日 #

xlent

摘要: 1.概述 XLNet 与 Bert 有着许多的不同,XLNet 利用一个全新的模型Transformer-XL作为语义表示的骨架, 将置换语言模型的建模作为优化目标,同时在预训练阶段也利用了更多的数据。 最终,XLNet 在多个 NLP 任务上达到了 SOTA 的效果。 2.Two-Stream S 阅读全文

posted @ 2020-05-17 00:17 杨杨09265 阅读(180) 评论(0) 推荐(0) 编辑