园龄：3年9个月粉丝：37 关注：8

Contrastive Learning 对比学习 | 何恺明大神的 SimSiam

论文题目：Exploring Simple Siamese Representation Learning，CVPR 2021。
pdf：https://arxiv.org/abs/2011.10566
相关博客：
- 知乎 | 无门槛级讲解对比学习中的自监督模型 Simsiam （通俗易懂）
- 知乎 | 对比学习（Contrastive Learning）：研究进展精要（解释了为什么 Simsiam 会演变成这样）
- 知乎 | SimSiam：孪生网络表征学习的顶级理论解释（解释 Simsiam 的 stop-gradient 与 EM / k-means 算法的联系）
- 知乎 | SimSiam 论文阅读
- 简书 | SimSiam 论文简析——笔记

算法思想

输入 x, x1, x2，其中 x 代表数据集中的一张图片，x1, x2 是数据增强（data augmentations）得到的两张图片。注意，原图片并不作为输入。
接下来，x1, x2 通过 同一个 编码器（encoder）编码，得到两个表征向量 z1=f(x1), z2=f(x2)。这个编码器一般使用经典卷积神经网络 ResNet。这一步的目的就是通过卷积神经网络提取特征，得到感受野大、维度较小的向量。
然后，我们将 z1 经过一个 MLP 映射得到 p1=h(z1) ，最大化 p1, z2 的 cosine similarity，作为目标函数去学习。其实，我们的目标函数是一个对称的（symmetric）函数，也就是不仅要算 p1, z2 的相似度，还要计算 p2=h(z2), z1 的相似度。

主要技术

collapsing：
- 既然 loss function 只想让所有相似图片彼此接近，那么就把所有人映射到一起好了（）
- 解决方案：设计不对称的 branch、训练负样本彼此远离、stop-gradient 等。
stop-gradient：
神秘的 MLP 层 h ：
- 作者发现，如果不添加 h，性能很差；如果 h 的参数无法学习，模型难以收敛。这个 MLP 层实际上是在 预测数据增强分布上的数学期望，从而试图矫正由数据增强带来的随机性而导致的误差。

上一篇offline RL · PbRL | Preference Transformer：反正感觉 transformer 很强大

下一篇offline RL | D4RL：最常用的 offline 数据集之一

本文作者：MoonOut

本文链接：https://www.cnblogs.com/moonout/p/18059713

版权声明：本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @ 2024-03-07 20:40 MoonOut 阅读(1093) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Contrastive Learning 对比学习 | RL 学 representation 时的对比学习

· 论文速读记录 | 2024.12

· 论文解读（MERIT）《Multi-Scale Contrastive Siamese Networks for Self-Supervised Graph Representation Learning》

· simCLR_A simple framework for contrastive learning of visual representations.

· 对比学习的两篇文章，其实没有看懂，但是提到了SimCLR和SimSiam

阅读排行：
· [翻译] 为什么 Tracebit 用 C# 开发
· 腾讯ima接入deepseek-r1，借用别人脑子用用成真了~
· Deepseek官网太卡，教你白嫖阿里云的Deepseek-R1满血版
· DeepSeek崛起：程序员“饭碗”被抢，还是职业进化新起点？
· RFID实践——.NET IoT程序读取高频RFID卡/标签

1 Sibelius: Violin Concerto in D Minor, Op. 47:III. Allegro, ma non tanto Jascha Heifetz / Chicago Symphony Orchestra

Sibelius: Violin Concerto in D Minor, Op. 47:III. Allegro, ma non tanto - Jascha Heifetz / Chicago Symphony Orchestra

00:00 / 00:00

An audio error has occurred.