随笔 - 70
文章 - 0
评论 - 0
阅读 -
1889
随笔分类 - 深度学习
point net
摘要:def __init__(self, k=40, normal_channel=True): __init__方法是一个特殊的方法,用于类的初始化。当创建一个类的新实例时,__init__方法会自动被调用,以设置对象的初始状态或属性。 self.feat = PointNetEncoder(glob
阅读全文
神经网络可视化
摘要:1、卷积核 卷积神经网络的每一层参数都是一组卷积核即权重。 2、特征层 在CNN输出结果之前,有一个高维的特征问量,该层离最终输出层最近、也是最能代图像特征的一层。这一层的特征,除了可以直接通过交叉熵损失做分类,还经常会用于进行图像比对和搜索。得到了多张图片的高维向量之即可通过计算向量距离的方法得到
阅读全文
产生式模型
摘要:机器学习中包含三大类问题:有监督学习、无监督学习以及强化学习。训练数据集中主要包含2类元素:数据x以及标签y。当数据集中x、y均为已知时,待解决的问题为有监督学习;当已知数据x但不知道标签y时,待解决的问题即为无监督学习。前几章介绍的分类、检测、分割均为有监督学习。自编码器自编码器(Autoenco
阅读全文
分割
摘要:1、语义分割 将图片中的所有像素进行分类(包括背景),不区分具体目标,仅做像素级分类。 2、实例分割对于有多个目标的图片,对每个目标完成像素级的分类,并区分每一个目标(即区分同一个类别但属于不同的目标)。 FCN 对原图的每个像素进行分类,将输出层的每一个像素点当作分类任务做一个 Softmax.即
阅读全文
SSD训练细节
摘要:sampling·py import random import torch import torch.nn as nn from torch.autograd import Variable from torch.autograd import Function from bbox import
阅读全文
目标检测
摘要:定位+分类定位+分类问题是分类到目标检测的一个过渡问题,从单纯地图片分类到分类后给出目标所处的位置,再到多目标的类别和位置,定位问题需要模型返回目标所在的外界矩形框,即目标的(x,y,w,h)四元组。 将定位当作回归问题,具体步骤如下。1)训练(或下载)一个分类模型,例如,AlexNet、VGGNe
阅读全文
卷积神经网络
摘要:全连接层全连接层(Fully Connected Layer)可以理解为神经网络的一个隐藏层,它包含权重向量W和激活函数。具体来说,对于一张32*32*3的图片(宽和高均为32个像素,有RGB三个通道,可以将其理解为一个32*32*3的矩阵),要通过全连接层,首先要将其拉伸为3072*1的向量作为神
阅读全文
pytorch实现神经网络图像分类
摘要:Tensor在PyTorch中,最核心的数据结构就是Tensor了,可以认为Tensor与Numpy中的ndarrays 非常类似,但是Tensor可以使用GPU加速而ndarrays不可以。 在pytorch进行GPU运算 if torch.cuda.is_available(): x=x.cud
阅读全文
深度学习与图像识别(误差反向传播)
摘要:误差反向传播法一 一个高效计算权重以及偏置量的梯度方法 ReLU 反向传播实现 class Relu: def _init_(self): self.x = None def forward(self,x): self.x = np.maximum(0,x) out = self.x return
阅读全文
numpy公式小总结1
摘要:umpy.array()产生的数据可以是一维,二维乃至n维 numpy.matrix() 产生的数据是严格的二维 numpy.abs()计算绝对值numpy.linalg.norm()计算范数,默认计算L2范数numpy.linsapce()指定的间隔内返回均匀间隔数组numpy.maximum()
阅读全文
numpy中的向量
摘要:梯度在各自空间的每一个点上对应的物理量概有强度,也有方向,将这些既有大小又有方向的场抽像出来便可以得到向量场。松手瞬间小球运动方向在X1X2平面上的投影就是梯度下降方向也叫下山方向,它反方向叫梯度向量,也叫上山方向·行向量转置可得到列向量,转置运算符为b=aT可以用len (a)计算向量元素个数 构
阅读全文
深度学习与图像识别(神经网络基础2)
摘要:1、跟随梯度(数值微分) 不需要随机寻找权重,可以直接计算最好的方向,这个方向就是损失函数的梯度。梯度就是在每个维度上偏导数形成的向量。 计算梯度有两种方法,一种是缓慢的近似方法,即数值梯度法,另一种是分析梯度法,需要使用微分,虽然计算迅速,结果精确但是实现时容易出错 对上述公式编写一个函数 def
阅读全文
制作训练样本(屋顶提取)
摘要:1、选取的图像最好是正射影像 2、新建面矢量,覆盖住图像中的建筑。 3、进行矢量转栅格,重分类为1,将Nodata改为0.(后期使用栅格计算器相加得不出0与1的结果) 4、继续新建面矢量,覆盖整个图像,矢量转栅格后重分类为0. 5、使用栅格计算器,将图像栅格与建筑栅格相加,获取有0、1标注的样本。
阅读全文
深度学习与图像识别(神经网络基础)
摘要:一个神经网络的训练算法就是让权重的值调整到最佳,以使得整个网络的预测(或者分类)效果最好。 一般来说更多神经元的神经网络可以表达更复杂的函数。然而这既是优势也是不足,优势是可以分类更复杂的数据,不足是可能会造成对训练数据的过拟合。过拟合(Overfitting)是指网络对数据中的噪声有很强的拟合能力
阅读全文
深度学习与图像识别day5(机器学习基础)
摘要:线性问题主要处理回归问题,回归问题即预测一个连续问题的数值。 计算决定系数(R-squared,也称为R²或系数决定)是衡量回归模型预测准确性的一个常用指标。R-squared值越接近1,表示模型的预测性能越好;如果R-squared值为0,则表示模型只是简单地预测了目标变量的平均值;如果R-squ
阅读全文
深度学习与图像识别day4
摘要:KNN在Cifar上的应用 def getXmean(X_train): X_train = np.reshape(X_train, (X_train.shape[0], -1)) # 将图片从二维展开为一维 mean_image = np.mean(X_train, axis=0) # 求出训练集
阅读全文
深度学习与图像分类day3(KNN算法)
摘要:KNN——最近邻算法(即选择最近的占比最高的类别作为预测类别) KNN算法的计算逻辑 1)给定测试对象,计算它与训练集中每个对象的距离。 2)圈定距离最近的k个训练对象,作为测试对象的邻居。 3)根据这k个近邻对象所属的类别,找到占比最高的那个类别作为测试对象的预测类别。 在 KNN算法中,有两个方
阅读全文
深度学习与图像识别(numpy2)
摘要:获取numpy属性 首先,我们通过Numpy中的一个方法 arange(n),生成0到n-1的数组。 np.arange(15) 返回的结果是array([ 0, 1, 2,3,4,5, 6,7, 8,9,10,11,12,13,14) 然后,再通过Numpy 中的reshape(row,colum
阅读全文
深度学习与图像识别学习笔记day2(numpy数组的方法)
摘要:创建numpy数组 import numpy as np nparray = np.array([i for i in range(10)]) print(nparray) 创建数值都为0的数组 import numpy as np a = np.zeros(10) print(a) 得到的结果0都
阅读全文
深度学习与图像识别学习笔记day1
摘要:文件不可以与现有的包重名哦 1、Theano (旧) 一个python库,可用于定义、优化与计算数学表达式,特别是多维数组(numpy.ndarray),可以理解为一个数学表达式的编译器:用符号式语言定义程序员所需的结果,并可以高效的运行与GPU与CPU上。 2、Tensorflow(新) 基于计算
阅读全文