2020 年 1月 31 日随笔档案 - xieyan0811

2020年1月31日

摘要：引入 2018年底发布的BERT模型和2019年初发布的GPT-2模型，开始挑战人类的语言处理能力。二者都基于之前介绍过的Transformer基础模型。对模型的研究有几个层次：研究基础模型、扩展模型、应用模型研究基础模型我们熟知的卷积神经网络CNN，... 阅读全文

posted @ 2020-01-31 15:29 xieyan0811 阅读(82) 评论(0) 推荐(0) 编辑

摘要：引入 Transformer-XL超长上下文的注意力模型，出自CMU和Google Brain在2019年1月发表的论文：《Transformer-XL: Attentive Language Models Beyond a Fixed-Length Cont... 阅读全文

posted @ 2020-01-31 14:53 xieyan0811 阅读(68) 评论(0) 推荐(0) 编辑

公告