摘要:
Introduction (1)IVPR问题: 根据一张图片从视频中识别出行人的方法称为 image to video person re-id(IVPR) 应用: ① 通过嫌犯照片,从视频中识别出嫌犯; ② 通过照片,寻找走失人口. (2)图片-视频行人匹配问题的描述: (3)IVPR的难点: ① 阅读全文
摘要:
摘要 (1)方法: 面对不同行人视频之间和同一个行人视频内部的变化,提出视频间和视频内距离同时学习方法(SI2DL). (2)模型: 视频内(intra-vedio)距离矩阵:使得同一个视频更紧凑; 视频间(inter-vedio)距离矩阵:使得两个匹配视频比不匹配视频距离更小. 设计了视频三元组( 阅读全文
摘要:
人脸识别 1、One-shot learning(一次学习): 仅仅通过一张图片来完成人脸识别,即只能通过一个样本来学习. similarity函数: d(img1,img2) = degree of difference between images 识别任务(verification): if 阅读全文
摘要:
1、目标定位:(以定位汽车为例) 将图像分类:行人、汽车、摩托车、纯背景图,使用softmax函数输出结果. 输出的结果不仅仅是分类,还有四个标记:bx、by、bh、bw. 这四个数据为被检测对象的边界框的参数. 左上角坐标(0,0),右下角坐标(1,1). 输出结果的表示形式: 2、特征点检测: 阅读全文
摘要:
1、经典网络: (1)LeNet-5:识别手写数字 (2)AlexNet: (3)VGG-16: 2、Residual networks(ResNets 残差网络): (1)Residual block(残差块): 多个残差块构成一个残差网络: (2)残差网络的优势: 理论上,随着神经网络的深入,训 阅读全文
摘要:
1、Edge detection(边缘检测): (1)卷积计算: 有一个6*6*1的灰度图像,‘*’表示卷积(convolution),过滤器(filter)为3*3矩阵. 卷积的结果为 4*4的矩阵: 左上角的第一块是通过图像矩阵的左上角3*3区域计算而来. 3*1 + 1*1 + 2*1 +0* 阅读全文
摘要:
1、超参数调试: (1)超参数寻找策略: 对于所有超参数遍历求最优参数不可取,因为超参数的个数可能很多,可选的数据过于庞大. 由于最优参数周围的参数也可能比较好,所以可取的方法是:在一定的尺度范围内随机取值,先寻找一个较好的参数,再在该参数所在的区域更精细的寻找最优参数. (2)选择合适的超参数范围 阅读全文
摘要:
神经网络和深度学习 Week 1-2 神经网络基础 Week 3 浅层神经网络 Week 4 深层神经网络 改善深层神经网络 Week 1 深度学习的实用层面 Week 2 优化算法 Week 3 超参数调试、Batch正则化和程序框架 卷积神经网络 Week 1 卷积神经网络基础 Week 2 深 阅读全文
摘要:
1、Mini-batch 梯度下降: (1)问题背景: 假设数据集含有500万个样本,数据量庞大,训练速度缓慢. 数据构成为: X = [x(1), x(2), ..., x(m)] 规格:n*m Y = [y(1), y(2), ..., y(m)] 规格:1*m 若将数据集分成若干个子集,即mi 阅读全文
摘要:
1、L 层神经网络正则化: (1)L2 正则化: (2)为什么正则化可以避免过拟合? 当 lambda 足够大时,最小化 J 时,就会使得权重矩阵 w 趋近于0,神经网络简化为高偏差状态: lambda 较大,w 较小,由 z = w * a + b,z 也较小,以 tanh 函数为例: 当 z 在 阅读全文