深度学习中的batch_size、epoch和iterations - 落日峡谷 - 博客园

Loading [MathJax]/extensions/TeX/extpfeil.js

深度学习中的batch_size、epoch和iterations

在进行模型训练的时候经常会遇到这三个参数：batch_size、epoch和iterations，那么它们之间的关系是怎样的呢？

首先，产生的原因主要是：

1. 原本的大批量梯度下降训练时，每次要处理完所有数据才更新梯度和损失值，需要的时间太长，计算开销大。

2. 但是呢，每次计算一个数据，就更新一次损失值和梯度值，虽然速度快，但是不容易收敛，而且不一定找到全局最优解。

于是，就出现了折中方法 —— 小批量梯度下降策略，所以就有了这些概念。

batch_size：指的是每批次的大小，即每个iteration送入神经网络的样本量，也就是每个batch包含的样本量。

iterations：指的是迭代次数，也就是每处理完所有数据一次，需要多少次迭代，每一个batch_size的数据，完成一次训练过程，叫做完成了一次迭代(iteration)。

epoch：一个epoch指的是，将所有数据送入神经网络，完成一次整体的前向计算和反向传播的过程。

通俗一点说：如果我们有10000个样本，分为4个batch，

那么batch_size值就是：10000/4=2500；

iterations值就是：4；

全体数据被计算一次，就完成了一次epoch。

##

参考：

https://www.jianshu.com/p/e5076a56946c/

https://blog.csdn.net/nini_coded/article/details/79250703

posted on 2020-03-18 16:13 落日峡谷阅读(1099) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】博客园社区专享云产品让利特惠，阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

公告

昵称：落日峡谷
园龄： 6年6个月
粉丝： 31
关注： 2

导航

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

统计

随笔 - 150
文章 - 0
评论 - 17
阅读 - 124万

随笔分类 (171)

随笔档案 (150)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:曼哈顿距离、欧拉距离、余弦距离等
字写的不错；
Euclidean Distance不是叫“欧拉距离”吧，应该是“欧几里得距离”。
--阿佑001
2. Re:Python绘制混淆矩阵，汉字显示label
有一个地方要改一下 “# 显示数据 for first_index in range(len(confusion)): #第几行 for second_index in range(len(confu...
--mygj
3. Re:Pyspark中遇到的 java.io.IOException: Not a file 和 pyspark.sql.utils.AnalysisException: 'Table or view not found
请问下第二种情况，表存在但是pyspark跑出来报错说不存在但是能找到default这个库可以查看到时什么原因
--sei你爷爷骑单车
4. Re:Python绘制混淆矩阵，汉字显示label
请问这个混淆矩阵中的数字有点偏，怎么设置居中于每个格子呢
--w553
5. Re:Python的散点图绘制 scatter
写的很详细，很有帮助。
--小村铁匠