摘要:
1.Vscode安装: 参考:https://blog.csdn.net/weixin_43793181/article/details/124456809 2.Opencv编译安装: 参考:https://blog.csdn.net/xiangfengl/article/details/12294 阅读全文
摘要:
一、工作中有时会用到的一些功能,记录下来 //遍历文件夹下的文件,输入:文件夹路径,返回文件名的vectorvoid get_image_names(const string &file_path, vector<string>&file_names) { intptr_t hFile = 0; / 阅读全文
摘要:
import numpy as np import math def ssd_anchor_one_layer(img_shape,feat_shape,sizes,ratios,step,offset=0.5,dtype=np.float32): """Computer SSD default a 阅读全文
摘要:
1.利用darknet53或者其他网络生成三个尺度的特征图,每个特征图都有(4+1+num_classes)个通道。 2.根据3种尺度的特征图进行预测框(预测框也分3个尺度进行),根据公式,激活函数sigmoid,t为卷积的结果,c为网格左上角坐标,b为预测的框。 3.损失主要分为3部分: (1)g 阅读全文
摘要:
举个例子简单介绍下训练英文和数字的数据处理方式 (1)CHAR_VECTOR = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-'.!?,\"" 图片命名为下面两串字符 (2)batch_y:['abdominosco 阅读全文
摘要:
结合开源项目tensorflow-yolov3(https://link.zhihu.com/?target=https%3A//github.com/YunYang1994/tensorflow-yolov3),理解YOLO v3实现细节整体套路 简单写写 1.数据预处理 voc_annotati 阅读全文
摘要:
数据的输入几乎和Faster rcnn一样,标签格式xml是一样的。 相比Faster rcnn,数据多了一步处理,通过voc_annotation.py将图片路径和bbox+class存储在txt下样式如下: data\train/VOCdevkit/VOC2007\JPEGImages\0000 阅读全文
摘要:
假如一个bbox坐标为:[35 220 62 293 3] 第一步:将bbox转换为中心坐标和宽高形式(3种缩放比例进行缩放) 那么onehot:[0 0 0 1 0 0 0 0 0 0 ........],当然还可以平滑 计算bbox的中心坐标和宽高(35+62)/2 = 48.5 (220+29 阅读全文
摘要:
水平翻转(标注翻转): def random_horizontal_flip(image, bboxes): _, w, _ = image.shape # [::-1] 顺序相反操作 # a = [1, 2, 3, 4, 5] # a[::-1] # Out[3]: [5, 4, 3, 2, 1] 阅读全文
摘要:
YOLOv1和YOLOv2简单看了一下,详细看了看YOLOv3,刚看的时候是蒙圈的,经过一番研究,分步记录一下几个关键的点: v2和v3中加入了anchors和Faster rcnn有一定区别,这个anchors如何理解呢? 个人理解白话篇: (1)就是有一批标注bbox数据,标注为左上角坐标和右下 阅读全文