11 2019 档案

摘要: 阅读全文
posted @ 2019-11-29 21:52 橙同学的学习笔记 阅读(559) 评论(0) 推荐(0)
摘要:由于在读文献期间多次遇见KISSME,都引自这篇CVPR,所以详细学习一下. Introduction 度量学习在机器学习领域有很大作用,其中一类是马氏度量学习(Mahalanobis metric learning). 什么是马氏距离?参考该篇文章【传送门】 KISS含义为:keep it sim 阅读全文
posted @ 2019-11-27 20:30 橙同学的学习笔记 阅读(752) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2019-11-26 23:15 橙同学的学习笔记 阅读(1103) 评论(0) 推荐(0)
摘要:Introduction (1)背景知识: ① 人脸识别是具有高可靠性的生物识别技术,但在低解析度(resolution)和姿态变化下效果很差. ② 步态(gait)是全身行为的生物识别特征,大部分步态识别方法是基于轮廓而不受外貌影响,但在复杂的背景和遮挡下轮廓难以提取. (2)问题场景: 假设行人 阅读全文
posted @ 2019-11-26 10:39 橙同学的学习笔记 阅读(369) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2019-11-24 21:26 橙同学的学习笔记 阅读(412) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2019-11-23 20:36 橙同学的学习笔记 阅读(661) 评论(0) 推荐(0)
摘要:综述类 名称 出版单位 1:行人重识别相关综述 (多篇) 行人重识别 名称 领域分类 方法分类 方法名称 出版单位 2:Video-Based Person Re-Identification by Simultaneously Learning Intra-Video and Inter-Video 阅读全文
posted @ 2019-11-23 15:20 橙同学的学习笔记 阅读(656) 评论(0) 推荐(0)
摘要:Introduction (1)IVPR问题: 根据一张图片从视频中识别出行人的方法称为 image to video person re-id(IVPR) 应用: ① 通过嫌犯照片,从视频中识别出嫌犯; ② 通过照片,寻找走失人口. (2)图片-视频行人匹配问题的描述: (3)IVPR的难点: ① 阅读全文
posted @ 2019-11-23 15:13 橙同学的学习笔记 阅读(719) 评论(0) 推荐(0)
摘要:摘要 (1)方法: 面对不同行人视频之间和同一个行人视频内部的变化,提出视频间和视频内距离同时学习方法(SI2DL). (2)模型: 视频内(intra-vedio)距离矩阵:使得同一个视频更紧凑; 视频间(inter-vedio)距离矩阵:使得两个匹配视频比不匹配视频距离更小. 设计了视频三元组( 阅读全文
posted @ 2019-11-21 16:43 橙同学的学习笔记 阅读(964) 评论(0) 推荐(0)
摘要:人脸识别 1、One-shot learning(一次学习): 仅仅通过一张图片来完成人脸识别,即只能通过一个样本来学习. similarity函数: d(img1,img2) = degree of difference between images 识别任务(verification): if 阅读全文
posted @ 2019-11-19 11:09 橙同学的学习笔记 阅读(729) 评论(0) 推荐(0)
摘要:1、目标定位:(以定位汽车为例) 将图像分类:行人、汽车、摩托车、纯背景图,使用softmax函数输出结果. 输出的结果不仅仅是分类,还有四个标记:bx、by、bh、bw. 这四个数据为被检测对象的边界框的参数. 左上角坐标(0,0),右下角坐标(1,1). 输出结果的表示形式: 2、特征点检测: 阅读全文
posted @ 2019-11-18 14:38 橙同学的学习笔记 阅读(1434) 评论(0) 推荐(0)
摘要:1、经典网络: (1)LeNet-5:识别手写数字 (2)AlexNet: (3)VGG-16: 2、Residual networks(ResNets 残差网络): (1)Residual block(残差块): 多个残差块构成一个残差网络: (2)残差网络的优势: 理论上,随着神经网络的深入,训 阅读全文
posted @ 2019-11-15 21:23 橙同学的学习笔记 阅读(723) 评论(0) 推荐(0)
摘要:1、Edge detection(边缘检测): (1)卷积计算: 有一个6*6*1的灰度图像,‘*’表示卷积(convolution),过滤器(filter)为3*3矩阵. 卷积的结果为 4*4的矩阵: 左上角的第一块是通过图像矩阵的左上角3*3区域计算而来. 3*1 + 1*1 + 2*1 +0* 阅读全文
posted @ 2019-11-13 20:36 橙同学的学习笔记 阅读(967) 评论(0) 推荐(0)
摘要:1、超参数调试: (1)超参数寻找策略: 对于所有超参数遍历求最优参数不可取,因为超参数的个数可能很多,可选的数据过于庞大. 由于最优参数周围的参数也可能比较好,所以可取的方法是:在一定的尺度范围内随机取值,先寻找一个较好的参数,再在该参数所在的区域更精细的寻找最优参数. (2)选择合适的超参数范围 阅读全文
posted @ 2019-11-11 22:16 橙同学的学习笔记 阅读(363) 评论(0) 推荐(0)
摘要:神经网络和深度学习 Week 1-2 神经网络基础 Week 3 浅层神经网络 Week 4 深层神经网络 改善深层神经网络 Week 1 深度学习的实用层面 Week 2 优化算法 Week 3 超参数调试、Batch正则化和程序框架 卷积神经网络 Week 1 卷积神经网络基础 Week 2 深 阅读全文
posted @ 2019-11-10 20:35 橙同学的学习笔记 阅读(570) 评论(0) 推荐(0)
摘要:1、Mini-batch 梯度下降: (1)问题背景: 假设数据集含有500万个样本,数据量庞大,训练速度缓慢. 数据构成为: X = [x(1), x(2), ..., x(m)] 规格:n*m Y = [y(1), y(2), ..., y(m)] 规格:1*m 若将数据集分成若干个子集,即mi 阅读全文
posted @ 2019-11-10 15:29 橙同学的学习笔记 阅读(511) 评论(0) 推荐(0)
摘要:1、L 层神经网络正则化: (1)L2 正则化: (2)为什么正则化可以避免过拟合? 当 lambda 足够大时,最小化 J 时,就会使得权重矩阵 w 趋近于0,神经网络简化为高偏差状态: lambda 较大,w 较小,由 z = w * a + b,z 也较小,以 tanh 函数为例: 当 z 在 阅读全文
posted @ 2019-11-08 22:30 橙同学的学习笔记 阅读(549) 评论(0) 推荐(0)
摘要:1、深层神经网络中的前向传播: (1)单数据情况: z[1] = w[1]x + b[1] a[1] = g[1](z[1]) z[2] = w[2]a[1] + b[2] a[2] = g[2](z[2]) ... ... z[l] = w[l]a[l-1] + b[l] a[l] = g[l]( 阅读全文
posted @ 2019-11-05 22:20 橙同学的学习笔记 阅读(503) 评论(0) 推荐(0)
摘要:1、计算神经网络的输出(正向传播): 矩阵表示: 向量化: 2、多个样本的向量化(正向传播): 3、激活函数: (1)sigmoid函数仅用于二分分类的情况,较少使用; a = 1 / (1 + e-z) g'(z) = g(z) * (1 - g(z)) (2)tanh函数绝大多数情况下优于sig 阅读全文
posted @ 2019-11-03 22:28 橙同学的学习笔记 阅读(1253) 评论(0) 推荐(0)
摘要:1、什么是神经网络? (1)房价预测模型Ⅰ: 神经网络:size x ——> O ——> price y ReLU函数(Rectified linear unit 修正线性单元):修改线性的函数,避免出现price未负数的情况. (2)房价预测模型Ⅱ: 即神经网络为: 2、Binary classi 阅读全文
posted @ 2019-11-03 09:47 橙同学的学习笔记 阅读(1184) 评论(0) 推荐(0)
摘要:1、介绍OCR: OCR(Photo optical character recognition 照片光学字符识别) 应用于读取电子照片中的文字. 2、算法思路: ① 识别文字区域; ② 字符切分: ③ 识别字符: 3、Sliding windows(滑动窗): (1)在行人检测中的使用: ① 由于 阅读全文
posted @ 2019-11-01 10:44 橙同学的学习笔记 阅读(1125) 评论(0) 推荐(0)