会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
mantch
公告
日历
导航
博客园
首页
新随笔
新文章
联系
订阅
管理
2019年9月26日
Transformer各层网络结构详解!面试必备!(附代码实现)
摘要: 1. 什么是Transformer 《Attention Is All You Need》是一篇Google提出的将Attention思想发挥到极致的论文。这篇论文中提出一个全新的模型,叫 Transformer,抛弃了以往深度学习任务里面使用到的 CNN 和 RNN。目前大热的Bert就是基于Transformer构建的,这个模型广泛应用于NLP领域,例如机器翻译,问答系统,文本摘要和语音识别等...
阅读全文
posted @ 2019-09-26 15:08 mantch
阅读(39404)
评论(2)
推荐(3)
编辑
Copyright © 2024 mantch
Powered by .NET 8.0 on Kubernetes