莫烦PyTorch学习笔记(六)——批处理

1.要点
Torch 中提供了一种帮你整理你的数据结构的好东西, 叫做 DataLoader, 我们能用它来包装自己的数据, 进行批训练. 而且批训练可以有很多种途径。
2.DataLoader
DataLoader 是 torch 给你用来包装你的数据的工具. 所以你要讲自己的 (numpy array 或其他) 数据形式装换成 Tensor, 然后再放进这个包装器中. 使用 DataLoader 有什么好处呢? 就是他们帮你有效地迭代数据, 举例:
复制代码
import torch

import torch.utils.data as Data


BATCH_SIZE = 5  # 批训练的数据个数,每组五个

x = torch.linspace(1, 10, 10)  # x data (torch tensor)

y = torch.linspace(10, 1, 10)  # y data (torch tensor)

# 先转换成 torch 能识别的 Dataset

torch_dataset = Data.TensorDataset(x,y)

# 把 dataset 放入 DataLoader

loader = Data.DataLoader(

    dataset=torch_dataset,  # torch TensorDataset format

    batch_size=BATCH_SIZE,  # 每组的大小

    shuffle=True,  # 要不要打乱数据 (打乱比较好)

)

for epoch in range(3):  # 对整套数据训练三次,每次训练的顺序可以不同

    for step, (x, y) in enumerate(loader):  # 每一步 loader 释放一小批数据用来学习

        # 假设这里就是你训练的地方...

        # 打出来一些数据

        print('Epoch: ', epoch, '| Step: ', step, '| batch x: ',

             x.numpy(), '| batch y: ', y.numpy())
复制代码

通过批处理计算可以加快训练的速度

Python中enumerate用法详解

posted @   你的雷哥  阅读(1089)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
· 零经验选手,Compose 一天开发一款小游戏!
点击右上角即可分享
微信分享提示