几篇关于Transformer和Bert讲得不错的文章

这些关于Transformer和Bert的文章不错,做一下记录:

 

《Transformer模型浅析》

https://zhuanlan.zhihu.com/p/74723305

文中引用了一篇国外的博客:https://jalammar.github.io/illustrated-transformer/

另外关于这一句话:然后将结果除以 [公式] (这样做的目的是得到更稳定的梯度)

可以参考这篇文章得到更详细的解释:《transformer:从数学角度解释为什么用缩放点积会有更稳的梯度》

https://zhuanlan.zhihu.com/p/371143022

 

《BERT模型浅析》

https://zhuanlan.zhihu.com/p/74750529

下面是Bert应用于不同目标的结构:

 

 

参考了这篇文章:《从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史》

https://zhuanlan.zhihu.com/p/49271699

 

posted @   blcblc  阅读(65)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
历史上的今天:
2018-02-10 剑指Offer - 开始没做出来 —— 验证后序序列是否正确
2018-02-10 剑指Offer - 这道题目还蛮难的,做了好几遍才通过
2017-02-10 推荐系统与算法
点击右上角即可分享
微信分享提示