摘要:
Learning Transferable Visual Models From Natural Language Supervision link CLIP 全称 Contrastive Language-Image Pre-training 时间:21.02 机构:OpenAI TL;DR 一种 阅读全文
摘要:
VIT: AN IMAGE IS WORTH 16X16 WORDS link TL;DR 首篇使用纯Transformer来做CV任务的文章。 Method 首先将图像拆成多个图片Patch,每个Patch通过LindearProjection变成embedding特征,使用Transformer 阅读全文
摘要:
Transformer ) 名称解释: Self-Attention: 类似于CNN里面的Conv层,是Transformer中重复次数最多的特征提取Layer。 Multi-Head Attention: 相对于Self-Attention,将每个节点外接多个q、k、v head。 Cross A 阅读全文
摘要:
目录视觉SLAM特征点法2D-2D对极几何3D-2D PnP3D-3D ICP光流法说明直接法理论模型(最小化光度误差)一些细节问题工程问题安装sophus 视觉SLAM 特征点法 特征点提取+匹配 ORB = Fast + ORiented Brief 特征点:Fast10(9/11),即如果周围 阅读全文
摘要:
三维点云处理 Cluster 对给定点集$p_i, i \in {1,2,...n}$进行聚类。 K-means (1) 随机初始化K个中心点 (2) 每个点$p_i$属于分配一个距离最近的点 (3) 更新中心点位置 (4) check converge 变种: K-Medoids(K中心点法):中 阅读全文
摘要:
Caffe使用经验积累 本贴记录Caffe编译好了,使用过程的常用命令与常见错误解决方式。如果对编译过程还存在问题,请参考 "史上最全的caffe安装过程" 配置Caffe环境。 1 使用方法 训练网络 选择某个模型作为预训练模型 继续之前的状态续训 画出网络结构 选择多gpu进行训练 设置系统环境 阅读全文
摘要:
1 安装Torch 本文介绍Torch7的安装方法,因为本人安装Torch前安装了caffe,所以可能CUDA、cudnn、Blas等Torch可能需要用来的库的安装就不再重复介绍了,相关依赖出现问题的的猿友可以参考 "史上最全的caffe安装过程" 。 1.1 安装luarock lua是通过lu 阅读全文
摘要:
Linux下的GPU版Caffe安装方法 系统环境:Ubuntu 14.04LTS + NV TitanX 1.1 (可选)显卡驱动的安装(有风险) 如果需要重装,需要先卸载已有版本 再重装一个比较稳定的版本 或者安装其它最新版本的驱动,但一定注意,通过apt get或者yum安装, 不要用官方的. 阅读全文
摘要:
创新点:基于Faster RCNN使用更高效的基础网络 1.1 创新点 PVAnet是RCNN系列目标方向,基于Faster RCNN进行改进,Faster RCNN基础网络可以使用ZF、VGG、Resnet等,但精度与速度难以同时提高。PVAnet的含义应该为:Performance Vs Acc 阅读全文
摘要:
1 YOLO 创新点: 端到端训练及推断 + 改革区域建议框式目标检测框架 + 实时目标检测 1.1 创新点 (1) 改革了区域建议框式检测框架: RCNN系列均需要生成建议框,在建议框上进行分类与回归,但建议框之间有重叠,这会带来很多重复工作。YOLO将全图划分为SXS的格子,每个格子负责中心在该 阅读全文