GNN —— 李沐老师论文跟读
摘要:原博客地址:https://staging.distill.pub/2021/gnn-intro/?ref=https://githubhelp.com 由于该博客发表在distill上,具有许多交互性的图片,可以很好对原文作出解释,故本博客截取了较多原文中的图片。建议去原博客体验交互效果方便更好地
阅读全文
Transformer —— 李沐老师论文跟读
摘要:论文地址:https://arxiv.org/pdf/1706.03762 摘要 当时的序列转录模型主要依赖于复杂的循环或者卷积神经网络加encoder+decoder架构组成,而论文提出了一种简单的网络架构transformer,在原有的encoder+decoder基础上增加注意力机制,而不使用
阅读全文
ResNet —— 李沐老师论文跟读
摘要:论文地址:https://arxiv.org/pdf/1512.03385v1.pdf 引言 作为一篇发表于2015年的文章,至今我们仍在深度卷积神经网络中用到ResNet,作为一个神经网络初学者,我觉得很有必要去阅读一下这篇文章。 在ResNet发表之前,深层神经网络的训练非常困难,而且会遇到当网
阅读全文