随笔分类 -  CV & Image Processing

摘要:参考: 基于拉普拉斯金字塔的图像融合原理以及C++实现 图像融合:拉普拉斯金字塔融合算法 阅读全文
posted @ 2022-06-12 12:50 Picassooo 阅读(320) 评论(0) 推荐(0) 编辑
摘要:转自:目标检测评价标准mAP mAP全称是mean Average Precision,这里的Average Precision,是在不同recall下计算得到的。对于所有类别的AP求平均就得到mAP了。 模板检测模型中,如果AP50高,说明模型的定位能力有了;AP95低,说明模型的定位能力还不够精 阅读全文
posted @ 2022-06-07 11:03 Picassooo 阅读(168) 评论(0) 推荐(0) 编辑
摘要:本文摘自:什么是语义分割、实例分割、全景分割 目标检测(object detection) 识别图像中存在的内容和检测其位置,如下图,以识别和检测人(person)为例 语义分割(semantic segmentation) 对图像中的每个像素打上类别标签,如下图,把图像分为人(红色)、树木(深绿) 阅读全文
posted @ 2022-05-11 16:05 Picassooo 阅读(1288) 评论(0) 推荐(0) 编辑
摘要:本文摘自:图像对齐:从SIFT到深度学习 传统的图像对齐方法 传统的基于特征的图像对齐方法包括三个步骤: 关键点检测和特征描述 特征匹配 图像变换 简而言之,选择两个图像中的兴趣点,将参考图像中的每个兴趣点与浮动图像中的对应点相关联,并对浮动图像进行变换,以使两个图像对齐。 关键点检测和描述 关键点 阅读全文
posted @ 2022-04-27 10:05 Picassooo 阅读(3526) 评论(0) 推荐(0) 编辑
摘要:程序示例: import torch from PIL import Image import torchvision.transforms as transforms def cutout(input): input[:, 100:200, 100:200] = 0.0 # 注意:这是in-pla 阅读全文
posted @ 2021-12-16 11:08 Picassooo 阅读(270) 评论(0) 推荐(0) 编辑
摘要:程序示例: from torchvision import transforms from PIL import Image import torch def gaussian(img, mean, std): c, h, w = img.shape noise = torch.randn([c, 阅读全文
posted @ 2021-12-03 22:04 Picassooo 阅读(1168) 评论(0) 推荐(0) 编辑
摘要:示例代码: from torchvision import transforms from PIL import Image img_jpg = Image.open('C:/Users/admin/Desktop/bird.jpg').convert('RGB') # convert()函数,用于 阅读全文
posted @ 2021-12-02 15:13 Picassooo 阅读(2885) 评论(0) 推荐(0) 编辑
摘要:图像降噪算法——DnCNN / FFDNet / CBDNet / RIDNet / PMRID / SID 阅读全文
posted @ 2021-11-22 16:52 Picassooo 阅读(543) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-11-14 16:26 Picassooo 阅读(378) 评论(0) 推荐(0) 编辑
摘要:recognition vs classification The field of recognition or pattern recognition is concerned with the automatic discovery of regularities in data throug 阅读全文
posted @ 2021-11-09 23:01 Picassooo 阅读(1580) 评论(0) 推荐(0) 编辑
摘要:图嵌入 (Graph Embedding) 和图神经网络 (Graph Neural Network) Network embedding的目标是得到节点或者整个graph的低维特征向量。 GNN是一些用来端到端处理graph data相关任务的图模型。 阅读全文
posted @ 2021-10-28 16:57 Picassooo 阅读(886) 评论(0) 推荐(0) 编辑
摘要:loss不收敛或不下降问题处理经验 阅读全文
posted @ 2021-08-16 20:50 Picassooo 阅读(232) 评论(0) 推荐(0) 编辑
摘要:基本信息 NW-UCLA骨架数据 raw data下载链接。 每个视频都只有一个人。人身上设置了20个节点,如下图所示: NW-UCLA骨架数据总共1484个样本,平均时长39.4帧,最长的有201帧,最短的只有1帧(a02_s09_e04_v03.json和a02_s09_e04_v02.json 阅读全文
posted @ 2021-08-12 18:01 Picassooo 阅读(2707) 评论(2) 推荐(0) 编辑
摘要:DenseNet 阅读全文
posted @ 2021-08-08 15:33 Picassooo 阅读(36) 评论(0) 推荐(0) 编辑
摘要:Image: iNaturalist Competition Datasets CIFAR-LT ImageNet-LT LVIS: A Dataset for Large Vocabulary Instance Segmentation Video: VideoLT YouTube-8M 阅读全文
posted @ 2021-07-15 10:31 Picassooo 阅读(106) 评论(0) 推荐(0) 编辑
摘要:深度学习补缺补漏篇!准算法工程师总结出的超强面经(含答案) 阅读全文
posted @ 2021-07-05 19:46 Picassooo 阅读(35) 评论(0) 推荐(0) 编辑
摘要:非极大值抑制(Non-Maximum Suppression,NMS) 单类别NMS的numpy实现 def py_cpu_nms(dets, thresh): """Pure Python NMS baseline.""" #x1、y1、x2、y2、以及score赋值 x1 = dets[:, 0 阅读全文
posted @ 2021-05-23 16:01 Picassooo 阅读(87) 评论(0) 推荐(0) 编辑
摘要:一. Bag of Features图像检索算法 可参考:Bag of Features (BOF)图像检索算法,下图也来自这篇博客。 每幅图像都是一个bag,本质是一列频数表,也就是直方图向量。 人们认为,从图像中提取的SURF描述符(或者SIFT描述符等),这些描述符仍然属于一种浅层(low l 阅读全文
posted @ 2020-12-09 20:57 Picassooo 阅读(408) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示