随笔分类 -  深度学习

深度学习网络及其相关的知识点
摘要:1.yolov5预处理流程 1.等比缩放与填充:将输入图像等比缩放到目标尺寸(如640×640),并在多余部分填充灰条,保持图像的宽高比不变。这一过程也被称为“letterbox”。 2.颜色空间转换:将图像从BGR格式转换为RGB格式(OpenCV默认读取为BGR)。 3.归一化:将像素值从[0, 阅读全文
posted @ 2025-03-02 15:05 wancy 阅读(8) 评论(0) 推荐(0) 编辑
摘要:1.YOLOv8-seg简介 YOLOv8-seg是YOLO系列模型的其中一个版本。YOLOv8-seg在继承YOLO系列模型高效性和准确性的基础上,增加了实例分割的能力。 2.数据集 使用的数据集较简单,主要以下目录: images:存放原始图片(1500张),大小为128x128。部分如下: i 阅读全文
posted @ 2024-10-08 13:30 wancy 阅读(2076) 评论(0) 推荐(0) 编辑
摘要:1.Pixellib Pixellib 是一个基于 TensorFlow 和 OpenCV 的深度学习库,用于语义分割和实例分割任务,提供了强大的工具和库来构建和训练深度神经网络模型。Pixellib 支持多种主流深度学习模型,如 DeepLabV3、Mask R-CNN、YOLOv4、YOLOv5 阅读全文
posted @ 2024-06-22 16:12 wancy 阅读(71) 评论(0) 推荐(0) 编辑
摘要:1.伪彩色图 伪彩色(pseudo-color)图像是一种图像处理技术,用于将灰度图像或单通道图像映射到彩色空间,以便通过颜色差异来增强图像的视觉表现。在伪彩色图像中,不同的灰度级或数据值被赋予不同的颜色,从而创建出一个彩色的图像表示。伪彩色图每个像素值实际上是一个索引值或代码,该代码值作为色彩查找 阅读全文
posted @ 2024-05-25 17:55 wancy 阅读(299) 评论(0) 推荐(0) 编辑
摘要:前面介绍过了使用Paddleseg套件训练后,使用export.py文件导出模型为推理部署模型。具体可以参考之前的:https://www.cnblogs.com/wancy/p/18028138 本文介绍使用paddle自定义简单二分类CNN模型到训练数据集再到转换onnx模型推理。 1. 数据集 阅读全文
posted @ 2024-04-29 20:13 wancy 阅读(561) 评论(0) 推荐(0) 编辑
摘要:1. 报错问题 ValueError: (InvalidArgument) The axis is expected to be in range of [0, 0), but got 0 [Hint: Expected axis >= -rank && axis < rank == true, b 阅读全文
posted @ 2024-04-26 20:57 wancy 阅读(323) 评论(0) 推荐(0) 编辑
摘要:1. paddleocr PaddleOCR 是一个基于 PaddlePaddle 深度学习框架的开源 OCR(Optical Character Recognition,光学字符识别)工具。它提供了一系列的预训练模型和工具,可以用于文本检测、文本识别和文本方向检测等任务。 提供了易于使用的 Pyt 阅读全文
posted @ 2024-04-17 21:07 wancy 阅读(1906) 评论(0) 推荐(1) 编辑
摘要:1. darkne介绍 Darknet 是一个开源的深度学习框架,由 Joseph Redmon(YOLO~YOLOv3作者或参与者) 开发,主要用于实现神经网络模型。这个框架最初是为了实现计算机视觉任务而创建的,尤其是目标检测。其中最著名的应用之一就是 YOLO(You Only Look Onc 阅读全文
posted @ 2024-03-29 17:16 wancy 阅读(1126) 评论(0) 推荐(0) 编辑
摘要:1. ONNX (Open Neural Network Exchange) ONNX是一个开放的神经网络交换格式,它旨在提供一个统一的框架,使深度学习模型能够在不同的深度学习框架之间进行交换和共享。主要目标是解决深度学习框架之间的互操作性问题。在深度学习领域,有许多不同的框架,如 TensorFl 阅读全文
posted @ 2024-02-22 21:11 wancy 阅读(1352) 评论(0) 推荐(0) 编辑
摘要:图片数据集划分的方式与方法有很多,比如先将图片转换为矩阵,再使用scikit-learn包去划分。为了使得数据集更灵活,本文介绍python实现图片分类数据集的划分。 假设现在的数据集文件夹为flower_images,flower_images文件夹中有5类,每个类1000张。 使用自己的pyth 阅读全文
posted @ 2023-12-01 20:55 wancy 阅读(737) 评论(0) 推荐(0) 编辑
摘要:labelme是一种常用的开源图像标注工具,特别适用于语义分割标注。它提供了直观的用户界面,可以方便地标注每个像素的类别。 1.安装 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple labelme 也可以从github获取安装https 阅读全文
posted @ 2023-11-07 16:19 wancy 阅读(5084) 评论(0) 推荐(0) 编辑
摘要:1. 花数据集 数据集来自kaggle官网下载。分为五类花,每类花有1000张图片。下载方式可以参考我的https://www.cnblogs.com/wancy/p/17446715.html 2. 图片大小分布图 训练模型之前,我们会需要先分析数据集,由于此类数据集每类花的图片数量一样,是均衡的 阅读全文
posted @ 2023-06-12 20:15 wancy 阅读(93) 评论(0) 推荐(0) 编辑
摘要:1. kaggle介绍 Kaggle(官网:https://www.kaggle.com/)是由Anthony Goldbloom和Ben Hamner于2010年创立的一个数据科学社区。它为数据科学家和机器学习工程师提供了一个平台,可以在该平台上进行数据分析和建模活动,同时进行竞赛式的数据分析等活 阅读全文
posted @ 2023-05-31 18:11 wancy 阅读(2414) 评论(0) 推荐(0) 编辑
摘要:1. 训练模型代码 import numpy as np import tensorflow as tf # import tensorflow.compat.v1 as tf # tf.disable_v2_behavior() from captcha.image import ImageCap 阅读全文
posted @ 2023-05-28 23:14 wancy 阅读(182) 评论(0) 推荐(0) 编辑
摘要:1. softmax函数 在数学,尤其是概率论和相关领域中,归一化指数函数,或称Softmax函数,是逻辑函数的一种推广。它能将一个含任意实数的K维向量z“压缩”到另一个K维实向量σ(z)中,使得每一个元素的范围都在(0,1)之间,并且所有元素的和为1。该函数多用于多分类问题中。在多项逻辑回归和线性 阅读全文
posted @ 2023-05-11 11:50 wancy 阅读(266) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示