摘要: 这是一篇还在双盲审的论文,不过看了之后感觉作者真的是很有创新能力,ELECTRA可以看作是开辟了一条新的预训练的道路,模型不但提高了计算效率,加快模型的收敛速度,而且在参数很小也表现的非常好。 论文:ELECTRA: PRE-TRAINING TEXT ENCODERS AS DISCRIMINA 阅读全文
posted @ 2019-11-07 17:03 微笑sun 阅读(2034) 评论(0) 推荐(1) 编辑