2021年11月14日

星空智能对话机器人的Gavin认为Transformer是拥抱数据不确定性的艺术。

摘要: Transformer的架构、训练及推理等都是在Bayesian神经网络不确定性数学思维下来完成的。Encoder-Decoder架构、Multi-head注意力机制、Dropout和残差网络等都是Bayesian神经网络的具体实现;基于Transformer各种模型变种及实践也都是基于Bayesi 阅读全文

posted @ 2021-11-14 18:33 l_time 阅读(71) 评论(0) 推荐(0) 编辑

导航