08 2023 档案

摘要:赛题任务 : 语义分割任务赛题思路 : 构建深度学习语义分割模型完成步骤1: 基本的语义分割模型 (FCN或UNet )、损失函数,跑通流程步骤2 : 根据交又验证训练多个模型,完成模型结果集成步骤3 : 对预测闻值进行搜索&可视化,改进损失函数&模型结构步骤4 :寻找外部数据,构建预训练模型步骤5 阅读全文
posted @ 2023-08-26 13:53 dunimaa 阅读(40) 评论(0) 推荐(0) 编辑
摘要:摘要核心1.本文提出一种可以适用于多种任务的backbone->swin transformer2.Transformer迁移到CV中有两点挑战->物体尺度不一,图像分辨率大3.为了解决尺度不一的问题,Swin Transformer使用了分层的结构(Pyramid)4.为了能够在高分辨率上运行,S 阅读全文
posted @ 2023-08-26 09:49 dunimaa 阅读(119) 评论(0) 推荐(0) 编辑
摘要:目前的方法,无论是单阶段的还是两阶段的,无论是Anchor Based还是Ancho一例外的需要使用后处理方法->NMS来过滤掉冗余的预测框这是因为目前的方法全都基于Dense Frediction,合人类识别物体的方在原理上,这种操作方式不符式。在实践中,这会导致目标检测中会有一系列的手工设计痕迹 阅读全文
posted @ 2023-08-26 09:48 dunimaa 阅读(202) 评论(0) 推荐(0) 编辑
摘要:DETR是一个简洁的pipeline,但有一部分操作还是Dense的DETR提出了一套不同于Dense Prediction的pipeline,将检测视为一个Set Prediction问题,成功去掉了Anchor Generation和NMS但是在Decoder中,Object Query和Fea 阅读全文
posted @ 2023-08-26 09:48 dunimaa 阅读(66) 评论(0) 推荐(0) 编辑
摘要:1. 为什么有patch0,需要一个整合信息的向量,如果只有原始输出的9个向量,用哪个向量来分类都不好。 全用计算量又很大所以加一个可学习的vector,也就是patch 0来整合信息。分类需要,分割和检测不是 2. 位置编码 图像切分重排后失去了位置信息并且Transformer的内部运算是空间信 阅读全文
posted @ 2023-08-26 09:48 dunimaa 阅读(129) 评论(0) 推荐(0) 编辑
摘要:1. 一阶段和二阶段目标检测 一阶段:直接输出,端到端 二阶段:先提取候选框,再分析甄别 histogram of oriented gradient,HOG scale invariant feature transform,SIFT 单发多框检测与区域卷积神经网络(R-CNN)也存在以下主要区别 阅读全文
posted @ 2023-08-16 16:09 dunimaa 阅读(76) 评论(0) 推荐(0) 编辑
摘要:神经网络的梯度更新 反向传播算法:神经网络中加速计算参数梯度值的方法 梯度下降算法 -> 随机梯度下降、动量随机梯度 凸优化: 几何意义,任取一个集合中的两点练成一条线段,如果这条线段完全落在该集合中,那么这个集合就是凸集 BN训练测试: BN本质上是解决传播过程中的梯度消失问题 阅读全文
posted @ 2023-08-16 16:06 dunimaa 阅读(14) 评论(0) 推荐(0) 编辑
摘要:1. BN:Batch Normalization 深度神经网络随着网络深度加深,训练起来越困难,收敛越来越慢 2. 如何理解卷积 两个函数的卷积,本质上就是先将一个函数翻转,然后进行滑动叠加。 1) 从“积”的过程可以看到,我们得到的叠加值,是个全局的概念。以信号分析为例,卷积的结果是不仅跟当前时 阅读全文
posted @ 2023-08-10 09:23 dunimaa 阅读(9) 评论(0) 推荐(0) 编辑
摘要:1. 传统点云分割 点云分割是根据空间、几何和纹理等特征对点云进行划分,使得同一划分内的点云拥有相似的特征。点云的有效分割是许多应用的前提,例如在三维重建领域,需要对场景内的物体首先进行分类处理,然后才能进行后期的识别和重建。传统的点云分割主要依赖聚类算法和基于随机采样一致性的分割算法,在很多技术上 阅读全文
posted @ 2023-08-09 22:38 dunimaa 阅读(332) 评论(0) 推荐(0) 编辑
摘要:1. 随机扫描和光栅扫描 随机扫描是一种按照像素点的位置随机扫描的方式,显示器不是按照固定的顺序扫描每个像素点,而是根据需要扫描的像素点位置来决定扫描顺序。这种方式可以提高显示器的响应速度和显示质量,但需要更高的计算资源和更复杂的控制逻辑 2. 走样与反走样 走样通常是指在数字图像中出现锯齿状的现象 阅读全文
posted @ 2023-08-06 16:52 dunimaa 阅读(92) 评论(0) 推荐(0) 编辑
摘要:1. 理解形式语言学 形式语言通常作为定义编程语言和语法的基础,是正式版本的自然语言的子集。它能被具有有限计算能力的机器所解析。 1. 语言形式与语言功能:形式语言学研究语言的结构形式,而不关注语言表达的具体功能或意义。它把语言视为一套规则来递归生成句子,这些规则构成语言的「语法」。 2. 符号系统 阅读全文
posted @ 2023-08-06 16:52 dunimaa 阅读(184) 评论(0) 推荐(0) 编辑
摘要:第一步:现象确认 目的:确认和gpt处于同一讨论语境(对现象的认识达成一致) 提问模板:你知道xxx吗?(用地域、时间、学科类别进行限定) 第二步:学术概念化 提问模板:关于xx,在xx领域会用什么概念进行研究? 第三步:定位优质资源 (1)聚焦感兴趣的学术概念 提问模板:关于xxx,请推荐5篇引用 阅读全文
posted @ 2023-08-03 20:37 dunimaa 阅读(31) 评论(0) 推荐(0) 编辑
摘要:1. 序列模型 a)自回归模型 对见过的数据建模 b)马尔可夫模型 c)因果关系 2. 单机多卡并行 数据并行和模型并行: 数据并行,将小批量分成n块,每个GPU拿到完整参数计算,性能更好。模型并行,将模型分成n块,每个GPU拿到一块模型计算前向和方向结果,用于单GPU放不下 小批量分到多GPU计算 阅读全文
posted @ 2023-08-03 20:36 dunimaa 阅读(32) 评论(0) 推荐(0) 编辑
摘要:一:opencv中的绘图函数和几何变换 图像平移,rows和cols需要反置;缩放 下采样和上采样 二:图像增强 高斯滤波/中值滤波 直方图均衡化,Gamma变化:对输入图像灰度值进行的非线性操作使输出图像灰度值与输入图像灰度值呈指数关系 (指数大于1变亮小于1变暗) 三:形态学 主要用于从图像中提 阅读全文
posted @ 2023-08-03 20:36 dunimaa 阅读(54) 评论(0) 推荐(0) 编辑
摘要:学习目标掌握图像分割基本方法闽值法,包括固定闽值,大津闯值法和自适应闽值掌握图像边缘检测算子原理掌握Canny边缘检测方法学习连通区域分析,区域生长,分水岭等算法思想,能使用算法实现图像分割 一: 图像分割是指将图像分成若干具有相似性质的区域的过程,主要有基于闽值、基于区域、基于边缘、基于聚类、基于 阅读全文
posted @ 2023-08-03 20:35 dunimaa 阅读(147) 评论(0) 推荐(0) 编辑
摘要:图像特征图像特征提取与匹配是计算机视觉中的一个关键问题,在目标检测、物体识别、三维重建、图像配准、图像理解等具体应用中发挥着重要作用。图像特征主要有图像的颜色特征、纹理特征、形状特征和空间关系特征。 形状特征 HOG特征提取 方向梯度直方图 (Histogram of Oriented Gradie 阅读全文
posted @ 2023-08-03 20:35 dunimaa 阅读(122) 评论(0) 推荐(0) 编辑
摘要:摄像头调用 VideoCapture 视频读取保存 VideoWriter 帧差法 帧间差分法是通过对视频中相邻两帧图像做差分运算来标记运动物体的方法 当视频中存在移动物体的时候,相邻帧 (或相邻三帧) 之间在灰度上会有差别求取两帧图像灰度差的绝对值,则静止的物体在差值图像上表现出来全是0,而移动物 阅读全文
posted @ 2023-08-03 20:35 dunimaa 阅读(59) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示