摘要:
useradd -s /bin/bash name 新增用户 vi /etc/sudoers 新增一行,修改name,如下图 usermod -aG sudo name 增加sudo组 id name 确认结果 阅读全文
摘要:
一句话描述:ViLD基础上引入prompt 1、动机 2、方法 3、效果 4、消融实验 阅读全文
摘要:
1、MAE 基于VIT,BERT自监督的算法引用到CV;主要思路是遮住大量的块,使用非对称的编码解码器(编码器看非mask块) 视觉和BERT不同点: 1.图片的信息密度高,仅mask部分像素,可以通过周围像素差值来获得,因此这里需要mask掉很大的比例 2、NLP还原的是词,因此通过简单的全连接就 阅读全文
摘要:
0、图文多模态学习 包含以下: 普通多模态学习,如图文检索、视觉问答、视觉推理、视觉蕴含: CLIP language guided detection language guided segmentation 文本图像生成:Dall.E2, Stable Diffusion 文本视频生成 1、普通 阅读全文
摘要:
0、Abstract 自驾特征融合背景:自驾传感器方案由复杂的多个摄像头,激光雷达,rada等组成, 而融合多个传感器输入到统一视图的表示特征至关重要 BEV感知实现特征融合好处:BEV特征表示是 融合好的和直观的(可以直接在规控中使用) BEV感知核心问题: (a)如何通过透视视图到BEV的视图变 阅读全文
摘要:
1、地图篇 1.1、汽车上地图变迁 地图核心要素的地图的精度和要素的丰富度 汽车智能化驱动汽车上地图变迁,汽车上地图主要经历下面几个阶段: SD地图/标准地图:精度15米左右,道路拓扑组成,主要用于导航 LD地图/车道级地图: 精度亚米级,加入了道路级拓扑信息,主要用于辅助驾驶 HD地图/高精地图: 阅读全文
摘要:
1/Prompt-to-Prompt Image Editing with Cross Attention Control 阅读全文
摘要:
1.背景,问题定义和数据:https://zhuanlan.zhihu.com/p/478681885 3D bounding box有9个自由度,3个是位置,3个是旋转,3个是维度大小,认物体没有x轴旋转和z轴旋转(即假设物体都应贴合于地面),故物体一共有7个自由度 2.数据集 kitti数据集h 阅读全文
摘要:
语义分割、实例分割、全景分割的概念理解 阅读全文
摘要:
FINETUNED LANGUAGE MODELS ARE ZERO-SHOT LEARNERS 阅读全文