会员
商店
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
HaibaraYuki
博客园
首页
新随笔
联系
订阅
管理
随笔 - 39
文章 - 26
评论 - 0
阅读 -
901
前馈网络(Feed Forword)的参数量计算
Feed Forward(前馈网络)参数量计算
主要由2个全连接层组成,论文中全连接层的公式如下:
F
F
N
(
X
)
=
m
a
x
(
0
,
x
W
1
+
b
1
)
W
2
+
b
2
其中用到的两个参数W1和W2,已知
的
设
置
为
的
设
置
为
B
E
R
T
B
A
S
E
的
设
置
为
d
m
o
d
e
l
=
768
,BERT沿用了惯用的全连接层大小设置,即
4
∗
d
m
o
d
e
l
=
3072
,因此
与
与
W
1
(
768
,
3072
)
与
W
2
(
3072
,
768
)
故12层的全连接层参数为
12
∗
(
2
∗
768
∗
3072
)
=
56
,
623
,
104
好文要顶
关注我
收藏该文
微信分享
HaibaraYuki
粉丝 -
0
关注 -
6
+加关注
0
0
«
上一篇:
Positional Embedding
»
下一篇:
LayerNorm层参数量计算
posted @
2025-03-06 21:24
HaibaraYuki
阅读(
9
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
登录后才能查看或发表评论,立即
登录
或者
逛逛
博客园首页
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
相关博文:
·
LayerNorm层参数量计算
·
BERT词向量参数量计算_BASE
·
05 Transformer 中的前馈神经网络(FFN)的实现
·
网络中的参数量(param)和浮点计算量(FLOPs)的计算
·
前馈神经网络层(Feed-Forward Neural Network Layer)
阅读排行:
·
25岁的心里话
·
闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
·
零经验选手,Compose 一天开发一款小游戏!
·
通过 API 将Deepseek响应流式内容输出到前端
·
AI Agent开发,如何调用三方的API Function,是通过提示词来发起调用的吗
公告
昵称:
HaibaraYuki
园龄:
3个月
粉丝:
0
关注:
6
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
最新随笔
1.备份1
2.叫嚣若是代码能力够好->2025CVPR代码复现
3.编辑内容快捷键
4.Hyperspectral Image Classification Summarize
5.高光谱图像——丁晨组论文
6.Bias的作用
7.Multi-Heads Attention参数量计算
8.LayerNorm层参数量计算
9.前馈网络(Feed Forword)的参数量计算
10.Positional Embedding
积分与排名
积分 - 862
排名 - 317991
随笔分类
资源(5)
随笔档案
2025年3月(14)
2025年2月(2)
2025年1月(9)
2024年12月(14)
文章分类
CodeForces(2)
Kaggle(11)
UPloader(0)
大模型算法工程师(5)
基础知识课业(3)
文章档案
2025年2月(1)
2025年1月(11)
2024年12月(14)
阅读排行榜
1. Sequence-to-Sequence(91)
2. 监控GPU使用情况,三种形式(78)
3. 沉浸式翻译【Paper阅读&网站翻译】(71)
4. Dev-Cpp 中配置 easyx 图形库(41)
5. DataFrame的基本操作(34)
点击右上角即可分享
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 通过 API 将Deepseek响应流式内容输出到前端
· AI Agent开发,如何调用三方的API Function,是通过提示词来发起调用的吗