摘要: 1. GAN原理 1.1 从比较直观的角度理解 如图1、2所示,GAN包括一个生成器Generator和一个判别器Discriminator。其中,Generator是根据输入的一个vector生成一个图片,而判别器是将生成的图片输入网络,输出该图片为真实图片的概率。 图1 Generator 图2 阅读全文
posted @ 2022-02-16 11:13 指间的执着 阅读(116) 评论(0) 推荐(0) 编辑
摘要: VAE学习总结 VAE代码在VAE生成人脸代码一节。 阅读全文
posted @ 2022-02-15 23:04 指间的执着 阅读(932) 评论(0) 推荐(0) 编辑
摘要: 一、Batch Normalization(批量标准化)的介绍以及理解 在神经网络中,在每一层上,通常是将该层的输入乘以权重矩阵加上偏移值,然后将计算结果使用激活函数进行非线性变换。但是随着网络深度的增加,其激活函数的输入值(W*X+B)的分布会发生变化。 可能会向激活函数取值的饱和区域延伸(比如: 阅读全文
posted @ 2021-02-15 09:07 指间的执着 阅读(60) 评论(0) 推荐(0) 编辑
摘要: 一、训练加速 多GPU训练: 1.1 基于数据的并行 模型平均(Model Average)、同步随机梯度下降(SSGD)、异步随机梯度下降(ASGD) 模型平均(Model Average) 每个Client训练平均的训练数据,每个batch更新一个模型,然后分别将模型发送给Server,Serv 阅读全文
posted @ 2021-02-05 22:01 指间的执着 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 一、图像读入、显示和保存 1.读入图像 retval = cv2.imread(文件名[, 显示控制参数]) 显示控制参数参数如下: cv2.IMREAD_UNCHANGED cv2.IMREAD_GRAYSCALE cv2.IMREAD_COLOR …… 2.显示图像 None = cv2.ims 阅读全文
posted @ 2020-05-18 21:52 指间的执着 阅读(672) 评论(0) 推荐(0) 编辑
摘要: 1.项目简介 本项目实现人脸识别系统。 项目基本思路如下:对于输入的图片,首先通过MTCNN网络进行人脸检测,获取到人脸图片;并使用MTCNN网络检测到的人脸关键点信息通过仿射变换进行人脸对齐;然后使用insightface进行人脸特征提取,比较数据库中的数据,识别出人脸。项目结构如图所示: 图1 阅读全文
posted @ 2020-03-31 22:48 指间的执着 阅读(817) 评论(0) 推荐(0) 编辑
摘要: 支持向量机(support vector machine,SVM)是一种二分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使其有别于感知机。支持向量机还包括核技巧,使它成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划问题,也等价于正则 阅读全文
posted @ 2020-03-24 07:46 指间的执着 阅读(253) 评论(0) 推荐(0) 编辑
摘要: 1.概述 1.1 目标检测的定义 识别图片中有哪些物体以及物体的位置(坐标位置)。 其中,需要识别哪些物体是人为设定限制的,仅识别需要检测的物体;物体的坐标位置由两种表示方法:极坐标表示(xmin, ymin, xmax, ymax)和中心点坐标表示(x_center, y_center, w, h 阅读全文
posted @ 2020-03-15 14:06 指间的执着 阅读(5031) 评论(0) 推荐(0) 编辑
摘要: 1、项目介绍 1.1 项目架构设计 实现基于tensorflow的物体检测。项目框架主要分为三部分:数据采集层、深度模型层、用户层。其中,数据采集层用于对数据进行标记以及转换成TFRecords格式数据文件。深度模型层的功能是读取数据采集层输出的TFRecords数据进行数据的预处理以及对深度模型的 阅读全文
posted @ 2020-03-10 22:56 指间的执着 阅读(730) 评论(0) 推荐(0) 编辑
摘要: 一、二分类逻辑回归模型 逻辑回归是一种分类模型,由条件概率分布$P(Y|X)$表示,形式为参数化的逻辑分布。随机变量$X$的取值为 实数,随机变量$Y$的取值为0或1。通过监督学习的方法来估计参数模型。 对于二分类任务,逻辑回归模型为如下的条件概率: $P(Y=1|x)=\frac{e^{w\cdo 阅读全文
posted @ 2020-03-10 22:01 指间的执着 阅读(282) 评论(0) 推荐(0) 编辑