informer 各类图示

 

https://blog.csdn.net/weixin_49967436/article/details/121736079

 

 

 

 

 

3.1.Multi-Head Attention(图2-红色圆圈部分,图3-红色长方体)

 

 

 3.2.Self-sttention Distilling(图2-蓝色圆圈部分,图3-蓝色长方体)
目的:减少维度和网络参数

 

 3.3. 多个Layer stacking replicas(图2-黄色圆圈部分,图3-蓝色长方体[左边第一轮])
在这里插入图片描述

 3.3. 多个Layer stacking replicas(图2-黄色圆圈部分,图3-蓝色长方体[左边第一轮])
在这里插入图片描述

 

 

 

 

 

 

 

 

posted @   emanlee  阅读(56)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
· 零经验选手,Compose 一天开发一款小游戏!
历史上的今天:
2009-10-08 An error has occurred during report processing
2007-10-08 asp.net 2.0 中的 Webadmin.axd
点击右上角即可分享
微信分享提示