5月13日

二、训练部分
1、数据集介绍
我们使用的数据集是CASIA-WebFace数据集，对其进行了预处理，将其属于同一个人的图片放到同一个文件夹里面，并且进行了人脸的提取和人脸的矫正。

数据集里面有很多的文件夹，每一个文件夹里面存放同一个人的不同情况下的人脸。不同文件夹存放不同人的脸。

比如\0000045文件夹里面的人脸，属于同一个人。

2、LOSS组成
facenet使用Triplet Loss作为loss。
Triplet Loss的输入是一个三元组

a：anchor，基准图片获得的128维人脸特征向量
p：positive，与基准图片属于同一张人脸的图片获得的128维人脸特征向量
n：negative，与基准图片不属于同一张人脸的图片获得的128维人脸特征向量
我们可以将anchor和positive求欧几里得距离，并使其尽量小。
我们可以将anchor和negative求欧几里得距离，并使其尽量大。

我们所使用的公式为。
L = m a x ( d ( a , p ) − d ( a , n ) + m a r g i n , 0 ) L=max(d(a,p)−d(a,n)+margin,0)
L=max(d(a,p)−d(a,n)+margin,0)

d(a,p)就是anchor和positive的欧几里得距离。
d(a,n)就是negative和positive的欧几里得距离。
margin是一个常数。

d(a,p)前面为正符号，所以我们期望其越来越小。
d(a,n)前面为负符号，所以我们期望其越来越大。

即我们希望，同一个人的不同状态的人脸特征向量欧几里得距离小。
不同人的人脸特征向量欧几里得距离大。

但是由于仅仅只是用Triplet Loss会使得整个网络难以收敛，本文结合Cross-Entropy Loss和Triplet Loss作为总体loss。

Triplet Loss用于进行不同人的人脸特征向量欧几里得距离的扩张，同一个人的不同状态的人脸特征向量欧几里得距离的缩小。
Cross-Entropy Loss用于人脸分类，具体作用是辅助Triplet Loss收敛。

原文链接：https://blog.csdn.net/weixin_44791964/article/details/108220265

posted @ 2022-05-13 22:35 不咬牙阅读(57) 评论(0) 编辑收藏举报

刷新页面返回顶部

5月13日

公告