摘要: 模型保存、训练与验证 网络模型的保存与读取 在 PyTorch 中,模型的保存与加载有两种主要方式: 保存 & 加载完整模型(包括网络结构和参数) 只保存 & 加载模型参数(推荐方式) 可以直接跳过看最后几行。 PyTorch 提供 torch.save() 方法来保存模型,可以选择保存整个模型结构 阅读全文
posted @ 2025-02-15 17:05 钰见梵星 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 训练与优化 损失函数与反向传播 损失函数能够衡量神经网络输出与目标值之间的误差,同时为反向传播提供依据,计算梯度来优化网络中的参数。 torch.nn.L1Loss 计算所有预测值与真实值之间的绝对差。参数为 reduction : 'none':不对损失进行任何求和或平均,返回每个元素的损失。 ' 阅读全文
posted @ 2025-02-15 17:04 钰见梵星 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 深度学习模型构建 nn.Module torch.nn 是 PyTorch 提供的神经网络工具包,包含了构建神经网络所需的各种组件。nn.Module 是 PyTorch 中构建神经网络的基类,所有的神经网络模型都需要继承自该类。 import torch from torch import nn 阅读全文
posted @ 2025-02-15 17:03 钰见梵星 阅读(11) 评论(0) 推荐(0) 编辑
摘要: PyTorch 基础知识 基础知识 查看GPU nvidia-smi 查看PyTorch是否正常调用GPU import torch torch.cuda.is_available() 启动jupyter notebook jupyter notebook dir()函数可以查看包(如 torch) 阅读全文
posted @ 2025-02-15 17:03 钰见梵星 阅读(4) 评论(0) 推荐(0) 编辑
摘要: Transformer网络 传统的序列模型(如RNN、GRU和LSTM)在处理长序列时存在渐变消失问题,导致难以捕捉长距离依赖。这些模型采用逐步处理方式,每次只能处理一个单词或记号,因此存在信息流瓶颈。随着模型复杂性的增加(例如,从RNN到GRU,再到LSTM),处理复杂性也显著增加。 Transf 阅读全文
posted @ 2025-02-11 23:27 钰见梵星 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 序列模型和注意力机制 Seq2Seq模型主要用于处理输入序列到输出序列的映射问题,常用于机器翻译、语音识别等。主要由编码器(Encoder)和解码器(Decoder)构成。 编码器输入序列后生成一个固定长度的向量表示隐藏状态,通常采用RNN结构。输入序列的每个单词 x<t> 并更新隐藏 阅读全文
posted @ 2025-02-11 16:50 钰见梵星 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 自然语言处理与词嵌入 传统的词汇使用词汇表(Vocabulary)来存储,并用one-hot向量表示,向量长度等于词汇表大小,每个单词对应一个独特的索引,只有索引处的值为1,其余全部为0。如果 “max” 在词汇表里的索引是5391,那么对应的one-hot向量为 O5391。 但是这 阅读全文
posted @ 2025-02-09 16:31 钰见梵星 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 循环神经网络 序列数据输入和输出的长度可能不同,并且每个元素都有时间依赖性,传统的前馈神经网络无法有效建模序列信息,也无法共享特征。 典型的序列建模任务: 语音识别:输入一段语音音频,输出对应的文本记录,输入输出可能长度不同。 音乐生成:输入整数代表风格或者前几个音符,输出生成的音乐序列,仅输出是序 阅读全文
posted @ 2025-02-07 22:19 钰见梵星 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 人脸识别和神经风格转换 人脸识别 人脸验证(Verification):验证输入图像是否属于某个特定身份,属于一对一问题。 人脸识别(Recognition):一对多问题,从大量数据中找到匹配的人脸。 在很多人脸识别应用中,系统需要通过单一样本识别某人,而非多个样本,这就属于 One-shot Le 阅读全文
posted @ 2025-01-26 11:33 钰见梵星 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 目标检测 图片分类问题是判断图片中是否存在特定的对象。 图片定位分类问题除了判断图片是否包含特定对象外,还要定位对象在图像中的位置,并使用边界框(bounding box)标记出该位置。 边界框的四个参数为bx(中心点横坐标)、by(中心点纵坐标)、bh(高 阅读全文
posted @ 2025-01-24 23:02 钰见梵星 阅读(12) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示