摘要: 1 SUN RGB-D 论文:SUN RGB-D: A RGB-D Scene Understanding Benchmark Suite 数据集地址:http://3dvision.princeton.edu/projects/2015/SUNrgbd/ 简介:用于室内场景理解的RGBD数据集。 阅读全文
posted @ 2020-08-22 20:02 tofengz 阅读(5153) 评论(0) 推荐(0) 编辑
摘要: 1 torch.Tensor 操作函数 torch.cat(tensors, dim=0, *, out=None) → Tensor torch.chunk(input, chunks, dim=0) → List of Tensors torch.index_select(input, dim, 阅读全文
posted @ 2020-08-22 20:01 tofengz 阅读(1685) 评论(0) 推荐(0) 编辑
摘要: 在Python中,安装第三方模块,是通过包管理工具pip完成的。 模块的路径 当我们试图加载一个模块时,Python会在指定的路径下搜索对应的.py文件,如果找不到,就会报错。 默认情况下,Python解释器会搜索当前目录、所有已安装的内置模块和第三方模块,搜索路径存放在sys模块的path变量中: 阅读全文
posted @ 2020-08-20 21:59 tofengz 阅读(249) 评论(0) 推荐(0) 编辑
摘要: 因为种种原因,接触了很多视觉相关的任务,想稍作记录,也算没有浪费时间。 直推学习(transductive learning)和 归纳学习(inductive learning) 实际上我们平时所说的learning一般指的是inductive learning。 考虑普通学习问题,训练集为$D={ 阅读全文
posted @ 2020-08-19 23:03 tofengz 阅读(281) 评论(0) 推荐(0) 编辑
摘要: 损失函数 评价指标 Precision TP/(TP+FP) 同一Ground Truth只计算一次 Recall TP/(TP+FN) IoU(Intersection of Union) 任务:语义分割 TP/(TP+FP+FN) AP(Average Precision) 任务:目标检测,实例 阅读全文
posted @ 2020-08-19 18:05 tofengz 阅读(480) 评论(0) 推荐(0) 编辑
摘要: 推荐阮一峰老师的Docker入门教程 安装 镜像(image) 镜像相关的命令,采取规范的格式比较容易记忆: docker image ls docker image rm [image_name] docker image pull [image_name] docker image build 阅读全文
posted @ 2020-08-17 22:10 tofengz 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 0 过拟合与图像增强 通常我们训练一个深度卷积神经网络需要足够多的数据来防止模型过拟合,然而收集任务所需的数据往往代价较大。因此我们需要另辟蹊径,而图像增强就是另一种简单可行的防止过拟合的方法。 本质上,图像增强就是一个从已有的训练样本中创建新的训练样本的过程。要制作一个新样本,可以对原始图像进行轻 阅读全文
posted @ 2020-08-17 18:09 tofengz 阅读(982) 评论(0) 推荐(0) 编辑
摘要: 修改环境变量 查看变量,比如PATH: echo $PATH 给变量赋值(如果变量已经存在则覆盖,不存在则定义): LONGNAME='testlog' 向变量增添新的值(仅在当前终端生效): export PATH=~/test:$PATH 注意PATH变量中,路径以:间隔。 如果想维持某个更改, 阅读全文
posted @ 2020-08-07 08:45 tofengz 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 1 点云 在做3D视觉的时候,处理的主要是点云,点云就是由一些点的集合。点云在组成特点上分为两种,一种是有序点云,一种是无序点云。 有序点云:一般由深度图还原的点云,有序点云按照图方阵一行一行的,从左上角到右下角排列,当然其中有一些无效点因为。有序点云按顺序排列,可以很容易的找到它的相邻点信息。有序 阅读全文
posted @ 2020-08-01 23:11 tofengz 阅读(4625) 评论(0) 推荐(1) 编辑
摘要: 不知道为啥Kai Xu老师组的工作都是用matlab做的... 数据准备 ShapeNet数据集,取800个shape,包含3个类别(chair, tables, aeroplanes)。 对每个shape,渲60个RGB图像。包含每旋转30°调整3种高度,共12*3=36个视角,加上另外24个随机 阅读全文
posted @ 2020-07-31 22:57 tofengz 阅读(189) 评论(0) 推荐(0) 编辑