摘要:
from: https://zhuanlan.zhihu.com/p/103205929 这篇博客最好的地方是题图: 正文: RoBERTa 论文原文:Roberta 项目主页中文, 作者表示,在本项目中,没有实现 dynamic mask。 英文项目主页 从模型上来说,RoBERTa基本没有什么太 阅读全文
摘要:
from: https://zhuanlan.zhihu.com/p/51679783 2018年3月份,ELMo[1][2]出世,该paper是NAACL18 Best Paper。在之前2013年的word2vec及2014年的GloVe的工作中,每个词对应一个vector,对于多义词无能为力。 阅读全文