摘要: 读loss.py 阅读utils/loss.py,掌握YOLO算法的loss计算过程 这个损失函数跟YOLO-V5的损失函数相同,最关键的函数是build_target。原理很抽象,代码更抽象。想要读懂耗时大概2~3天。由于学长时间有限,所以就只把最关键的部分讲一下。 原理解析 对于某一张输入图片,YOLO算法把图片 阅读全文
posted @ 2022-12-31 22:50 Yuxi001 阅读(57) 评论(0) 推荐(0) 编辑
摘要: torch.repeat函数 函数功能 torch.tensor.repeat()函数可以对张量进行重复扩充1) 当参数只有两个时:(行的重复倍数,列的重复倍数),1表示不重复。2) 当参数有三个时:(通道数的重复倍数,行的重复倍数,列的重复倍数),1表示不重复。、 example: >>> x = 阅读全文
posted @ 2022-12-31 22:47 Yuxi001 阅读(242) 评论(0) 推荐(0) 编辑
摘要: torch.tensor.view() torch.tensor.view() 形式:Tensor.view(*shape) → Tensor 作用:返回一个新的张量,其数据与自张量相同,但形状不同。 说明:返回的张量共享相同的数据,并且必须具有相同数量的元素,但可能具有不同的大小。 当不清楚是否可以执行 view() 时,建议使用 re 阅读全文
posted @ 2022-12-31 22:37 Yuxi001 阅读(112) 评论(0) 推荐(0) 编辑
摘要: TORCH.ARANGE torch.arange(start=0, end, step=1, *, out=None, dtype=None, layout=torch.strided, device=None, requires_grad=False)→ Tensor Returns a 1-D 阅读全文
posted @ 2022-12-31 22:24 Yuxi001 阅读(46) 评论(0) 推荐(0) 编辑
摘要: 目标检测中的Anchor详解 👆原文链接 常用的Anchor Box定义 Faster R-CNN 定义三组纵横比ratio = [0.5,1,2]和三种尺度scale = [8,16,32],可以组合处9种不同的形状和大小的边框。 YOLO V2 V3 则不是使用预设的纵横比和尺度的组合,而是使 阅读全文
posted @ 2022-12-31 21:57 Yuxi001 阅读(112) 评论(0) 推荐(0) 编辑
摘要: Tensor总结 (1)Tensor 和 Numpy都是矩阵,区别是前者可以在GPU上运行,后者只能在CPU上; (2)Tensor和Numpy互相转化很方便,类型也比较兼容 (3)Tensor可以直接通过print显示数据类型,而Numpy不可以 Detector这个类在初始化的时候定义了许多成员 阅读全文
posted @ 2022-12-31 16:10 Yuxi001 阅读(16) 评论(0) 推荐(0) 编辑
摘要: pytorch的nn.Conv2d 官方解释: torch.nn.Conv2d()函数详解 参数详解:torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, 阅读全文
posted @ 2022-12-31 16:04 Yuxi001 阅读(90) 评论(0) 推荐(0) 编辑
摘要: HWC和CHW数据格式以及C++相互转换 原文链接↓ N C H W batch批量大小 channels,特征图通道数 特征图的高 特征图的宽 NCHW中,“N”batch批量大小,“C”channels特征图通道数,“H”特征图的高,和“W”特征图的宽。 在深度学习中,为了提升数据传输带宽和计算性能,image 或 feature ma 阅读全文
posted @ 2022-12-30 11:37 Yuxi001 阅读(2231) 评论(1) 推荐(2) 编辑
摘要: 一段代码from 'datasets.py': def collate_fn(batch): img, label = zip(*batch) for i, l in enumerate(label): if l.shape[0] > 0: l[:, 0] = i return torch.stac 阅读全文
posted @ 2022-12-30 09:58 Yuxi001 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 1.插值:interpolation 在离散数据的基础上补插连续函数,使得这条连续曲线通过全部给定的离散数据点。 插值是离散函数逼近的重要方法,利用它可通过函数在有限个点处的取值状况,估算出函数在其他点处的近似值。 插值:用来填充图像变换时像素之间的空隙。 img = cv2.resize(img, 阅读全文
posted @ 2022-12-29 09:40 Yuxi001 阅读(45) 评论(0) 推荐(0) 编辑