什么是Transformer

什么是transformer

参考资料：

自 2014 年推出以来，基于递归神经网络的序列到序列模型得到了很多人的关注。目前世界上的大多数数据都是以序列的形式存在的，它可以是数字序列、文本序列、视频帧序列或音频序列。

2015 年增加了注意力机制（Attention Mechanism），进一步提高了这些seq2seq模型的性能。在过去的五年里，自然语言处理的进步如此之快，令人难以置信！

Transformer是一种采用自注意力机制的深度学习模型。这一机制可以按输入数据各部分重要性的不同而分配不同的权重。Transformer模型于2017年由谷歌大脑的一个团队推出[2]，现已逐步取代长短期记忆（LSTM）等RNN模型成为了NLP问题的首选模型。

Transformer解决的问题是：

结论，这是一个seq2seq的model，对于CV来说，不是非常有借鉴意义。

posted @ 2022-11-01 00:03 bH1pJ 阅读(503) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 什么是BERT

· 什么是GPT

· transformer解读-更新中

· Transformer

· Transformer原论文

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配，妙~啊~
· .NET Core 中如何实现缓存的预热？

昵称： bH1pJ
园龄： 5年7个月
粉丝： 5
关注： 1

2025年3月

日

一

二

三

四

五

六