Pytorch搭建简单神经网络 Task2
1>建立数据集(并绘制图像)
1 # -*- coding: utf-8 -*- 2 #demo.py 3 import torch 4 import torch.nn.functional as F # 主要实现激活函数 5 import matplotlib.pyplot as plt # 绘图的工具 6 from torch.autograd import Variable 7 # 生成伪数据 8 x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) 9 y = x.pow(3) + 0.2*torch.rand(x.size()) #y=x³+b 10 11 # 变为Variable 12 x, y = Variable(x), Variable(y) 13 14 # 绘制数据图像 15 plt.scatter(x.data.numpy(), y.data.numpy()) 16 plt.show()
其中torch.linspace
是为了生成连续间断的数据,第一个参数表示起点,第二个参数表示终点,第三个参数表示将这个区间分成平均几份,即生成几个数据。因为torch
只能处理二维的数据,所以我们用torch.unsqueeze
给伪数据添加一个维度,dim
表示添加在第几维。torch.rand
返回的是[0,1)之间的均匀分布。
得到下图:
2>建立神经网络
1 lass Net(torch.nn.Module): # 继承 torch 的 Module 2 def __init__(self, n_feature, n_hidden, n_output): 3 super(Net, self).__init__() # 继承 __init__ 功能 4 self.hidden = torch.nn.Linear(n_feature, n_hidden) # 隐藏层线性输出 5 self.predict = torch.nn.Linear(n_hidden, n_output) # 输出层线性输出 6 7 def forward(self, x): 8 x = F.relu(self.hidden(x)) # 激励函数(隐藏层的线性值) 9 x = self.predict(x) # 输出值 10 return x 11 12 net = Net(n_feature=1, n_hidden=10, n_output=1) # 定义神经网络 13 print(net) # net 的结构
一般神经网络的类都继承自torch.nn.Module
,__init__()
和forward()
两个函数是自定义类的主要函数。在__init__()
中都要添加一句super(Net, self).__init__()
,这是固定的标准写法,用于继承父类的初始化函数。__init__()
中只是对神经网络的模块进行了声明,真正的搭建是在forwad()
中实现。自定义类中的成员都通过 self指针来进行访问,所以参数列表中都包含了self。
3>训练神经网络(并可视化训练过程)
1 # optimizer 是训练的工具 2 optimizer = torch.optim.SGD(net.parameters(), lr=0.2) # 传入 net 的所有参数, 学习率 3 loss_func = torch.nn.MSELoss() # 预测值和真实值的误差计算公式 (均方差) 4 5 # 训练100次 6 for t in range(100): 7 prediction = net(x) # 喂给 net 训练数据 x, 输出预测值 8 9 loss = loss_func(prediction, y) #计算两者的误差,一定要是输出在前,标签在后 (1. nn output, 2. target) 10 11 optimizer.zero_grad() # 清空上一步的残余更新参数值 12 loss.backward() # 误差反向传播, 计算参数更新值 13 optimizer.step() # 将参数更新值施加到 net 的 parameters 上 14 15 plt.ion() # 画图
训练网络之前我们需要先定义优化器和损失函数。torch.optim
包中包括了各种优化器,这里我们选用最常见的SGD
作为优化器。因为我们要对网络的参数进行优化,所以我们要把网络的参数net.parameters()
传入优化器中,并设置学习率(一般小于1)。由于这里是回归任务,我们选择torch.nn.MSELoss()
作为损失函数。由于优化器是基于梯度来优化参数的,并且梯度会保存在其中。所以在每次优化前要通过optimizer.zero_grad()
把梯度置零,然后再后向传播及更新。
可视化训练过程:
1 for t in range(100): 2 3 ... 4 loss.backward() 5 optimizer.step() 6 if t % 5 == 0: 7 # plot and show learning process 8 plt.cla() 9 plt.scatter(x.data.numpy(), y.data.numpy()) 10 plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5) 11 plt.text(0.5, 0, 'Loss=%.4f' % loss.data[0], fontdict={'size': 20, 'color': 'red'}) 12 plt.pause(0.1) 13 14 plt.ioff() 15 plt.show()
摘取了几个过程:
最终结果:
参考文档:
基于pytorch的简易卷积神经网络结构搭建-卷积神经网络(CNN)浅析
卷积神经网络CNN入门[pytorch学习]