目标检测概述

经典的深度学习模型

AlexNet(Error: 16%)
VGGNet(Error: 7%)
- VGG-16: conv3-64->conv3-64->maxpool -> conv3-128->conv3->128->maxpool -> conv3-256->conv3-256->conv3-256->maxpool -> conv3-512->conv3-512->conv3->512->maxpool -> conv3-512->conv3-512->conv3->512->maxpool -> fc4096->fc4096->fc1000->softmax
GoogLeNet(Error: 6%)
ResNet(Error: 3.57%)

目标检测

R-CNN
- 多个卷积层(框要大小统一) -> SVM分类
SPPNet
- 多个卷积层(框可以是任意大小)->ROI池化层(将任意大小的框转为统一大小的框)-> SVM分类
Fast-R-CNN
- 多个卷积层(框可以是任意大小)->ROI池化层(将任意大小的框转为统一大小的框)->两个全连接神经网络(一个softmax用于分类, 另外一个用于框回归)

MTCNN(Multi-task CNN)

P-Net
R-Net
O-Net
应用
- 人脸实时检测与人脸对齐

GAN

对抗网络

人脸识别(Face Recognition)

案例
- 现在有一个公司员工进入公司内部的身份验证系统, 与百度的类似, 但是是简化的版本, 现在有两种方案
  1. 每一个员工进入之前要初始自己的ID卡, 该卡上的磁条上有自己名字的信息, 同时员工还有对准相机进行脸部图像的获取, 在后台服务器的数据库中有一个name到encoding vector的映射, name就是公司中所有员工的姓名, encoding vector就是员工一开始录用拍摄的照片放入到神经网络中得到的编码; 输入name和图像, 将图像转为encoding vector, 根据name到dictionary中找到数据库中对应的encoding vector, 计算两个向量的L2范式距离, 如果小于一个阈值(比如0.7)表示为同一个人, 允许进入
  2. 与方案1不同的是, 现在不需要ID卡, 而是直接采用相机捕捉脸部图像的方法, 在服务器上的数据库还是那个字典, 当员工靠近时, 对准相机, 算法会将当前的人脸转为encoding vector, 接着去遍历dictionary中的encoding vector计算他们的L2范式距离, 得到对接近的dist, 在将该dist与阈值(如0.7)进行比较, 如果小于0.7则表示是同一个人, 允许进入; 此方法的好处是员工丢失了ID卡也没有关系
模型
- 采用DeepFace模型
- 每一个样本为 $(A^{(i)},P^{(i)},N^{(i)})$ , 其中A表示anchor(新的图片), positive(与anchor是同一个人的图片), negative(与anchor不是同一个人的图片), 这与我们之前遇到的样本长得不一样, 称之为triplet(三元组)
- L2计算公式 $||f(A^{(i)})-f(P^{(i)})||^2+\alpha \le ||f(A^{(i)})-f(N^{(i)})||^2$ , 其中 $\alpha$ 与SVM中的功能一样, 是一个软间隔; 变换一下为求最小化 $J=\sum_{i}^mmax({||f(A^{(i)})-f(P^{(i)})||^2}-||f(A^{(i)})-f(N^{(i)})||^2+\alpha)$ , 成为triplet loss(三元组损失)

posted @ 2019-04-06 10:47 gogogo11 阅读(490) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！
【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列：向量数据库的应用与畅想
· 从问题排查到源码分析：ActiveMQ消费端频繁日志刷屏的秘密
· 一次Java后端服务间歇性响应慢的问题排查记录
· dotnet 源代码生成器分析器入门

阅读排行：
· ThreeJs-16智慧城市项目（重磅以及未来发展ai）
· 软件产品开发中常见的10个问题及处理方法
· Vite CVE-2025-30208 安全漏洞
· 互联网不景气了那就玩玩嵌入式吧，用纯.NET开发并制作一个智能桌面机器人（四）：结合BotSharp
· MQ 如何保证数据一致性？

公告

昵称： gogogo11
园龄： 6年9个月
粉丝： 27
关注： 20

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类 (298)

随笔档案 (329)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:SVM 之 MATLAB 实现代码
不得不服，楼主这RBF核函数写的那叫一个秀啊！
--好学习的傻狍子
2. Re:SVM 之 MATLAB 实现代码
@考上研再打工感谢前人留下的宝贵意见...
--Mortality
3. Re:SVM之Python实现
大佬
--hard-work
4. Re:SVM 之 MATLAB 实现代码
作者你好，你的程序给学习中的我提供了巨大的参考，在此表示感谢！同时我也发现了你程序中的一些错误，我在运行你程序的时候，matlab会给出警告，提示黑塞矩阵不是对称的，虽然不影响程序运行，但是运行出来的...
--考上研再打工
5. Re:VS Code WSL 2 配置 Spring Boot 2
是代理服务器的问题, 导致 spring boot initialzr那个插件不能使用
关掉就好了, 谢谢您
--柠檬不萌只是酸