摘要:
一、背景 最早图像领域,后面应用到NLP领域 人类视觉注意力机制,扫描全局图像,获得重点关注区域,投入更多经历,抑制其它无用信息,提高视觉信息处理的效率与准确性。 在深度神经网络的结构设计中,attention所要分配的资源基本上就是权重了。 视觉注意力分为几种,核心思想是基于原有的数据找到其之间的 阅读全文
摘要:
构建数据流程是实践过程中核心环节。熟悉pipeline的的构建过程,有助于理解不同代码的结构,也是实现自主创建网络的第一步。 使用Pytorch实现神经网络模型的一般流程包括:1,准备数据 2,定义模型 3,训练模型 4,评估模型 5,使用模型 6,保存模型。 1- 数据加载 在Pytorch中构建 阅读全文
摘要:
from __future__ import print_function, division import torch import torch.nn as nn import torch.optim as optim from torch.optim import lr_scheduler im 阅读全文
摘要:
##训练分类器 import torch import torchvision import torchvision.transforms as transforms import torch.nn as nn import torch.nn.functional as F #1- 加载和预处理数据 阅读全文
摘要:
from __future__ import print_function import torch ##1 基本操作 #构建tensor x = torch.empty(5, 3) x = torch.rand(5, 3) x = torch.zero(5, 3, dtype=torch.long 阅读全文
摘要:
一、模型保存/加载 1.1 所有模型参数 训练过程中,有时候会由于各种原因停止训练,这时候我们训练过程中就需要注意将每一轮epoch的模型保存(一般保存最好模型与当前轮模型)。一般使用pytorch里面推荐的保存方法。该方法保存的是模型的参数。 对应的加载模型方法为(这种方法需要先反序列化模型获取参 阅读全文
摘要:
在学习和使用深度学习框架时,复现现有项目代码是必经之路,也能加深对理论知识的理解,提高动手能力。本文参照相关博客整理项目常用组织方式,以及每部分功能,帮助更好的理解复现项目流程,文末提供分类示例项目。 1 项目组织 在做深度学习实验或项目时,为了得到最优的模型结果,中间往往需要很多次的尝试和修改。一 阅读全文
摘要:
本系列为吴恩达斯坦福CS229机器学习课程笔记整理,以下为笔记目录: (一)线性回归 (二)逻辑回归 (三)神经网络 (四)算法分析与优化 (五)支持向量机 (六)K-Means (七)特征降维 (八)异常检测 (九)推荐系统 (十)大规模机器学习 第三章 神经网络 一、再论0/1分类问题 通过对特 阅读全文
摘要:
本系列为吴恩达斯坦福CS229机器学习课程笔记整理,以下为笔记目录: (一)线性回归 (二)逻辑回归 (三)神经网络 (四)算法分析与优化 (五)支持向量机 (六)K-Means (七)特征降维 (八)异常检测 (九)推荐系统 (十)大规模机器学习 第二章 逻辑回归 使用线性回归来处理 0/1 分类 阅读全文
摘要:
本系列为吴恩达斯坦福CS229机器学习课程笔记整理,以下为笔记目录: (一)线性回归 (二)逻辑回归 (三)神经网络 (四)算法分析与优化 (五)支持向量机 (六)K-Means (七)特征降维 (八)异常检测 (九)推荐系统 (十)大规模机器学习 第一章 线性回归 一、ML引言 学习行为,定制服务 阅读全文