卷积神经网络
卷积神经网络:CNN
应用领域:
CV领域、检测任务、分类与检索、超分辨率重构、医学任务、无人驾驶、人脸识别
卷积网络与传统网络区别:
维度:三维 二维
输入:原始图像(h*w*c) 向量
架构:
输入层 卷积层 池化层 全连接层
卷积层:
卷积:特征提取
权重参数矩阵【【1 0 1】,【0 1 0】,【1 0 1】】,和filter一样,在原始图当中选取多大的区域提取出一个特征
图像颜色通道:
RGB三个颜色通道,每一个通道单独去做卷积,之后把得到的结果矩阵加在一起
nputVelume *filter +bias=output(其中inputVelume*filter做内积计算)
fiter:卷积核,不同可以得到多个特征图
卷积需要做很多次:
low-level Feature | mid-level Feature | high-level Feature | Trainable Classifier |
原图 卷积 | 特征图 卷积 | 特征图 卷积 | 特征图 |
卷积层参数
滑动窗口步长:做卷积时,小窗口向右移动的步长,步长越大,得到的特征图越小,运行时间短
卷积核尺寸:fiter大小
边缘填充:外边界被卷积计算次数少,在图像外围加上0,记为+pad n,加上n圈0
卷积核个数:卷积核个数决定特征图个数,
卷积结果计算公式:
池化层:
压缩 downsampling 将224*224*64压缩112*112*64
maxpooling:某区域选择最大值
everagepooling:区域求平均值(效果不好,被pass)
架构综述:
卷积层+非线性变换 两次卷积一次池化
例:7层神经网络conv+RELU +conv+RELU+POOL+conv+RELU +conv+RELU+POOL+conv+RELU +conv+RELU+POOL+FC
FC:全链接层,
经典网络:
Alexnet:
8层网络、5层卷积、3层全链接
Vgg:
14年 卷积核大小3*3 16层网络
resnet:
残差网络,消除无用网络,使得层数越高,效果更好 特征提取
感受野:
特征图上的某个点能看到的输入图像的区域