摘要:
什么是深度卷积网络 ? (What are deep ConvNets learning?) 假如你训练了一个卷积神经网络,是一个 Alexnet,轻量级网络,你希望将看到不同层之间隐藏单元的计算结果。 从第一层的隐藏单元开始,假设你遍历了训练集,然后找到那些使得单元激活最大化的一些图片,或者是图片 阅读全文
摘要:
什么是神经风格转换?( What is neural style transfer?) 使用 C来表示内容图像 ,S表示风格图像 ,G表示表示生成的图像。 第一幅图像C是斯坦福大学,S是梵高的星空,G是最终生成的图像。第一幅图像C是旧金山的金门大桥,S是毕加索的画,G是最终生成的图像。为了实现神经风 阅读全文
摘要:
面部验证与二分类 (Face verification and binary classification) 另一个训练神经网络的方法是选取一对神经网络,选取 Siamese 网络,使其同时计算这些嵌入,比如说 128 维的嵌入,或者更高维,然后将其输入到逻辑回归单元,然后进行预测,如果是相同的人, 阅读全文
摘要:
Triplet 损失 要想通过学习神经网络的参数来得到优质的人脸图片编码,方法之一就是定义三元组损失函数然后应用梯度下降。 为了应用三元组损失函数,你需要比较成对的图像,比如这个图片,为了学习网络的参数,你需要同时看几幅图片,对于前两张图片,你想要它们的编码相似,因为这是同一个人,对于后两张图片,你 阅读全文
摘要:
Siamese 网络( Siamese network) 你经常看到这样的卷积网络,输入图片${x^{(1)}}$ ,然后通过一些列卷积,池化和全连接层,最终得到这样的特征向量,有时这个会被送进 softmax 单元来做分类,但是在这里不这样做,我们关注的是最终输出的向量,假设它是128维,它是由网 阅读全文
摘要:
One-Shot 学习( One-shot learning) 人脸识别所面临的一个挑战就是你需要解决一次学习问题,这意味着在大多数人脸识别应用中,你需要通过单单一张图片或者单单一个人脸样例就能去识别这个人。所以在一次学习问题中,只能通过一个样本进行学习,以能够认出同一个人。大多数人脸识别系统都需要 阅读全文
摘要:
候选区域( Region proposals (Optional)) 滑动窗法方法使用训练过的分类器,在这些窗口中全部运行一遍,然后运行一个检测器,看看里面是否有车辆,行人和摩托车。现在你也可以运行一下卷积算法,这个算法的其中一个缺点是,它在显然没有任何对象的区域浪费时间。 编号1,2的区域显然没有 阅读全文
摘要:
YOLO 算法(Putting it together: YOLO algorithm) 假设你要训练一个算法去检测三种对象,行人、汽车和摩托车,你还需要显式指定完整的背景类别。这里有 3 个类别标签,如果你要用两个 anchorbox,那么输出y就是 3×3×2×8,其中 3×3 表示 3×3 个 阅读全文
摘要:
Anchor Boxes 假设你有这样一张图片,对于这个例子,我们继续使用 3×3 网格,注意行人的中点和汽车的中点几乎在同一个地方,两者都落入到同一个格子中。所以对于那个格子,如果y输出这个向量: 你可以检测这三个类别,行人、汽车和摩托车,它将无法输出检测结果,所以我必须从两个检测结果中选一个。 阅读全文