pytorch的模块使用:线性模型(未完成)
首先上代码,注意代码里的注释,一般的在注释里说明:
import torch
# 注意这里必须写成两维的矩阵
x_data = torch.Tensor([[1.0], [2.0], [3.0]])
y_data = torch.Tensor([[2.0], [4.0], [6.0]])
class LinearModel(torch.nn.Module):
def __init__(self):
super(LinearModel, self).__init__()
self.linear = torch.nn.Linear(1, 1) # 输入特征和输出维度 都是一维的
# __call__() 中会调用这个函数!
def forward(self, x):
y_pred = self.linear(x)
return y_pred
# model为可调用的! 实现了 __call__()
model = LinearModel()
# 指定损失函数
# criterion = torch.nn.MSELoss(size_average=Flase) # True
criterion = torch.nn.MSELoss(reduction='sum') # sum:求和 mean:求平均
# -- 指定优化器(其实就是有关梯度下降的算法,负责),这里将优化器和model进行了关联
# optimizer = torch.optim.SGD(model.parameters(), lr=0.02)
# optimizer = torch.optim.Adam(model.parameters(), lr=0.02)
optimizer = torch.optim.Rprop(model.parameters(), lr=0.01) # 为啥这个这么快
for epoch in range(100):
y_pred = model(x_data) # 直接把整个测试数据都放入了
loss = criterion(y_pred, y_data)
print(epoch, loss.item())
optimizer.zero_grad() # 会自动找到所有的w和b进行清零!优化器的作用 (为啥这个放到loss.backward()后面清零就不行了呢?)
loss.backward()
optimizer.step() # 会自动找到所有的w和b进行更新,优化器的作用!
print('w = ', model.linear.weight.item())
print('b = ', model.linear.bias.item())
x_test = torch.Tensor([[4.0]])
y_test = model(x_test)
print('y_pred = ', y_test.data)
这里有几个步骤:
1 准备数据集
2 构造模型
3 指定损失函数
4 指定优化器
5 训练模型
6 用模型进行预测
这里我提几个问题,在后续的过程中,如果懂了再一一作答,懂得小伙伴有时间的评论区指点一二感谢。
问题1:loss.backward() 之后,求得了梯度,为啥优化器就可以直接更新权重了(optimizer.step() )?loss和optimizer什么时候关联在一起的?
答:再构建优化器的时候:
optimizer = torch.optim.Rprop(model.parameters(), lr=0.01)
optimizer拿到了模型的所有w和b
y_pred = model(x_data) # 直接把整个测试数据都放入了 loss = criterion(y_pred, y_data)
在训练的时候,loss和model建立的关系,这样应该是构建了loss和model的计算图。
这样的话loss和optimizer应该就都能访问到w和b以及他们的梯度。
问题2:optimizer.zero_grad() 为啥放到loss.backward()之后,整个结果就不对了?
问题3:训练好的model怎么保存下来?不可能每次预测之前都要训练一次吧?
作者:宋桓公
出处:http://www.cnblogs.com/douzi2/
如果您觉得阅读本文对您有帮助,请点一下“推荐”按钮,您的“推荐”将是我最大的写作动力!欢迎各位转载,但是未经作者本人同意,转载文章之后必须在文章页面明显位置给出作者和原文连接,否则保留追究法律责任的权利。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现
2015-06-21 一波三折Miz702终于能显示桌面上网啦