【原创深度学习与TensorFlow 动手实践系列 - 4】第四课：卷积神经网络 - 高级篇

【原创深度学习与TensorFlow 动手实践系列 - 4】第四课：卷积神经网络 - 高级篇

提纲：

1. AlexNet：现代神经网络起源

2. VGG：AlexNet增强版

3. GoogleNet：多维度识别

4. ResNet：机器超越人类识别

5. DeepFace：结构化图片的特殊处理

6. U-Net：图片生成网络

7. 实例：剖析VGG，用模型进行模型参数可视化，特征提取，目标预测

期待目标：

1. 掌握AlexNet结构特点，神经网络各层之间特征传导关系，模型参数总数计算

2. 了解VGG，GoogLeNet，ResNet等复杂ImageNet模型的结构特点，简单设计思想

3. 针对特殊数据，特殊任务设计的神经网络结构

4. 深度剖析VGG TF代码，学会对已有模型进行参数读取，目标预测，特征提取。

AlexNet：现代神经网络起源

背景介绍：

ImageNet Challenge：1000类物体，每类1000张图片

传统方法思路：

1. 图片特征提取

2. 机器学习分类

背景介绍：

2010年冠军

System Overview

Dense Grid descriptor：HOG，LBP

Coding：Local coordinate super-vector

Pooling, SPM

Linear SVM

2011年冠军：Xerox Lab

1. 特征提取

2. Fisher 压缩

3. SVM分类

VGG：AlexNet增强版

1. VGG-AlexNet 对比卷积层 - 卷积群参数个数：138m - 60m

2. 识别率（top5）7.3% - 15.3%

VGG作用：

1. 结构简单：同AlexNet结构类似，均为卷积层，池化层，全连接层的组合。

2. 性能优异：同AlexNet提升明显，同GoogleNet，ResNet相比，表现接近。

3. 选择最多的基本模型：方便进行结构的优化，设计，SSD，RCNN，等其他任务的基本模型（base model）

1. 为什么ResNet有效？

1. 前向计算：低层卷积网络高层卷经济网络信息融合；层数越深，模型的表现力越强。

2. 反向计算：导数传递更直接，越过模型，直达各层。

人脸识别数据特点：

结构化：所有人脸，组成相似，理论上能够实现对齐

差异化：相同位置，形貌不同

posted @ 2017-06-19 15:41 Jonson Li 阅读(688) 评论(0) 编辑收藏举报

刷新页面返回顶部