一

1

与传统的监督学习不同，few-shot leaning的目标是让机器学会学习；使用一个大型的数据集训练模型，训练完成后，给出两张图片，让模型分辨这两张图片是否属于同一种事物。比如训练数据集中有老虎、大象、汽车、鹦鹉等图片样本，训练完毕后给模型输入两张兔子的图片让模型判断是否是同一种事物，或者给模型兔子和狗的图片去判断。

2

训练的目的是靠着Support Set提供的一点信息，让模型判断出Query中的图片是otter这个类别，尽管训练数据集中没有otter这个类别。
k-way n-shot Support Set

k-way: the support set has k classes;

n-shot: every class has n samples.
k way表示支撑集中的类别，n shot表示支撑集中每个类别包含的样本数量

3

随着Support Set中类别增加，分类准确率会降低

因为3选1比6选1更容易，准确率更高;

同样地，Support Set中shot数量增加，分类准确率会提高

4

idea：学习一个相似度函数

sim函数来计算两张图片x和x'的相似度，

例如两张狗的图片x₁和x₂，一张猫的图片x₃，sim(x₁,x₂)=1, sim(x₁,x₃)=0，sim(x₂,x₃)=0

基本思想：

（1）首先，从一个大样本数据集中学习一个相似度函数

（2）然后，用相似度函数来做预测

①用query和support set的每一个样本逐一作比较；

②找出相似度得分最高的样本

5 常用的数据集

（1）Omniglot

https://github.com/brendenlake/omniglot or https://www.tensorflow.org/datasets/catalog/omniglot

（2）Mini-ImageNet

二连体网络Siamese Network

两种训练Siamese Network的方法

1 每次取两个样本，比较他们的相似度

需要用到一个大的带标签的数据集来训练神经网络，利用训练集来构造正样本Positive Samples和负样本Negative Samples

Positive Samples：每次从一个类别中随机抽取两张图片，把标签设置为1，即相似度满分，用这样的方法，也从其他类别中抽取图片，标签都设置为1；

Negative Samples：随机抽取一个类中的一张图片，排除掉这个类，再从其他类中随机抽取一张图片，把标签设置为0，即相似度为0，这样构造负样本。

搭建一个卷积神经网络来提取特征，输入图片记为x，输出特征向量记作f(x)

训练神经网络，将准备好的图片输入神经网络f，提取的两个特征向量记作h₁，h₂，z = |h₁-h₂|，再通过一个全连接层输出一个标量，最后使用sigmoid函数得到一个0~1之间的输出，这个输出就可以衡量两个图片之间的相似度，sim(x₁,x₂)。两张图片属于同一个类别，那么输出应该接近1，如果两张图片属于不同类别，那么输出应该接近0。损失函数是标签Target=1与sim(x₁,x₂)之间的差别，用来更新全连接层和神经网络f的参数（注意这里的图片输入的是同一个神经网络）之所以叫做连体网络，是这个网络的结构头部连在一起，如下图所示