基本的卷积神经网络
from torch import nn class SimpleCNN(nn.Module): def __init__(self): super(SimpleCNN, self).__init__() layer1 = nn.Sequential() # 将网络模型进行添加 layer1.add_module('conv1', nn.Conv2d(3, 32, 3, 1, padding=1)) # nn.Conv layer1.add_module('relu1', nn.ReLU(True)) layer1.add_module('pool1', nn.MaxPool2d(2, 2)) self.layer1 = layer1 layer2 = nn.Sequential() layer2.add_module('conv2', nn.Conv2d(32, 64, 3, 1, padding=1)) layer2.add_module('relu2', nn.ReLU(True)) layer2.add_module('pool2', nn.MaxPool2d(2, 2)) self.layer2 = layer2 layer3 = nn.Sequential() layer3.add_module('conv3', nn.Conv2d(64, 128, 3, 1, padding=1)) layer3.add_module('relu3', nn.ReLU(True)) layer3.add_module('pool3', nn.MaxPool2d(2, 2)) self.layer3 = layer3 layer4 = nn.Sequential() layer4.add_module('fc1', nn.Linear(2048, 512)) layer4.add_module('fc_relu1', nn.ReLU(True)) layer4.add_module('fc2', nn.Linear(512, 64)) layer4.add_module('fc_relu2', nn.ReLU(True)) layer4.add_module('fc3', nn.Linear(64, 10)) self.layer4 = layer4 def forward(self, x): conv1 = self.layer1(x) conv2 = self.layer2(conv1) conv3 = self.layer3(conv2) fc_input = conv3.view(conv3.size(0), -1) fc_out = self.layer4(fc_input) return fc_out model = SimpleCNN() # print(model) # 打印输出网络结构
提取前两层网络结构
new_model = nn.Sequential(*list(model.children())[:2]) # 提取前两层的网络结构, 构造nn.Sequential网络串接, * 表示将里面的内容一个个传进去
提取所有的卷积层网络
conv_model = nn.Sequential() # 提取所有的卷积层操作 for name, layer in model.named_modules(): if isinstance(layer, nn.Conv2d): name = name.replace('.', '_') conv_model.add_module(name, layer) print(conv_model)
打印卷积层的网络名字
for param in model.named_parameters(): print(param)
对权重参数进行初始化操作
from torch.nn import init # 对权重参数进行初始化操作 for m in model.modules(): if isinstance(m, nn.Conv2d): init.normal(m.weight.data) init.xavier_normal(m.weight.data) init.kaiming_normal(m.weight.data) elif isinstance(m, nn.Linear): m.weight.data.normal_()
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架