图像处理 - 随笔分类 - 静悟生慧

mmdetection 配置文件解读

摘要：mmdetection 详细解读：https://blog.csdn.net/syysyf99/article/details/96574325 简介faster_rcnn_r50_fpn_1x.py配置文件cascade_rcnn_r50_fpn_1x.py配置文件一、简介在使用mmdetect 阅读全文

posted @ 2020-01-15 15:18 静悟生慧阅读(9759) 评论(0) 推荐(2)

python处理RGBA格式的透明图片的粘贴

摘要：原文：https://blog.csdn.net/robinzhou/article/details/6960345 当需要将一张有透明部分的图片粘贴到一张底片上时，如果用Python处理，可能会用到PIL，但是PIL中有说明，在粘贴RGBA模式的图片是，alpha通道不会被帖上，也就是不会有透明阅读全文

posted @ 2019-12-25 16:19 静悟生慧阅读(2445) 评论(0) 推荐(0)

python使用matplotlib的savefig保存时图片保存不清晰以及不完整的问题

摘要：图片不清晰，需要指定dpi，图片保存大小问题，设置bbox_inches=‘tight’ (bbox_inches:可选bbox英寸。只保存图形的给定部分。如果“紧”，试着找出数字的紧框。如果没有，请使用savefig.bbox) https://blog.csdn.net/qq_31648921/ 阅读全文

posted @ 2019-12-24 15:07 静悟生慧阅读(8979) 评论(0) 推荐(0)

条形码识别

摘要：需要在线读条码、二维码? 可以试试Dynamsoft的免费在线条码解码工具。 https://demo.dynamsoft.com/DBR/BarcodeReaderDemo.aspx 这个条码扫描应用程序用了Dynamsoft barcode Reader SDK，解码准确度高，速度快，可以解出各阅读全文

posted @ 2019-12-13 11:55 静悟生慧阅读(1510) 评论(0) 推荐(0)

使用边缘检测，将图像旋转到水平位置

摘要：https://www.cnblogs.com/luofeel/p/9150968.html 边缘检测，霍夫变换 http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/imgproc/imgtrans/hough_lines/houg 阅读全文

posted @ 2019-12-12 21:35 静悟生慧阅读(820) 评论(0) 推荐(0)

opencv 图像resize

摘要：这是文档中的函数原型 cv2.resize(src, dsize[, dst[, fx[, fy[, interpolation]]]]) 参数说明src：要resize的原图，应该是一个矩阵 dsize：希望得到图像的shape，是一个tuple类型的数据，注意，这里是宽*高，而我们平常img.s 阅读全文

posted @ 2019-11-29 14:20 静悟生慧阅读(1853) 评论(0) 推荐(0)

OpenCV2 与opencv3 问题解决

摘要：本文链接：https://blog.csdn.net/ling_xiobai/article/details/79691785今天使用opencv运行一个脚本，但是出现cv2.cv.BoxPoints()函数有错，提示’module’ object has no attribute ‘cv’ 的错误阅读全文

posted @ 2019-11-29 12:17 静悟生慧阅读(1294) 评论(0) 推荐(0)

python 库 imgaug数据增强

摘要：安装及详细使用方法介绍： https://blog.csdn.net/qq_38451119/article/details/82428612 pip install imgaug 失败解决方法：提示Command "python setup.py egg_info" failed with er 阅读全文

posted @ 2019-06-04 15:31 静悟生慧阅读(1009) 评论(0) 推荐(0)

行人重识别-问题背景及方法

摘要：行人重识别综述： https://zhuanlan.zhihu.com/p/26168232 一个强力的ReID basemodel https://zhuanlan.zhihu.com/p/40514536 CVPR2018 ReID论文简评 https://zhuanlan.zhihu.com/ 阅读全文

posted @ 2019-03-05 17:16 静悟生慧阅读(1675) 评论(0) 推荐(0)

文本检测和识别代码结构梳理

摘要：前言：最近学习了一些OCR相关的基础知识，包含目标检测和自然语言处理。正好，在数字中国有相关的比赛： https://www.datafountain.cn/competitions/334/details/rule 所以想动手实践一下，实际中发现，对于数据标签的处理和整个检测和识别的流程并不熟悉阅读全文

posted @ 2019-02-22 20:33 静悟生慧阅读(3145) 评论(0) 推荐(0)

DCM 图片查看

摘要：因为要处理一些医学图像，需要把dcm格式的文件转换成jpg格式。本来用Sante DICOM Editor用得挺好的，方便查看dcm文件，但是在转换上每次只能转一张（本人没有找到用该软件批量转格式的方法）。于是在网上搜集了各种软件（图片格式转换大师、DCM图片转换大师等等），要么是要付费的，要么就是阅读全文

posted @ 2019-02-15 20:58 静悟生慧阅读(4174) 评论(0) 推荐(0)

汉字书法识别

摘要：单个汉字书法识别经验： https://cloud.tencent.com/developer/article/1142927 文化传承—汉字书法多场景识别 https://www.datafountain.cn/competitions/334/details/rank?sch=1420&page 阅读全文

posted @ 2019-02-14 09:29 静悟生慧阅读(1810) 评论(0) 推荐(0)

python .dcm文件读取，并转化为.jpg格式

摘要：.dcm文件是DICOM（Digital Imaging and Communications in Medicine）即医学数字成像和通信中记录医学图像和相关信息的文件，在用于医学图像处理的时候我们需要将·.dcm文件中的图像信息读取到python程序中来，下面展示了一个简单的示例。安装pydi 阅读全文

posted @ 2019-02-13 15:37 静悟生慧阅读(7370) 评论(0) 推荐(0)

GANS 资料

摘要：https://blog.csdn.net/a312863063/article/details/83512870 目录第一章初步了解GANs 3 1. 生成模型与判别模型. 3 2. 对抗网络思想. 3 3. 详细实现过程. 3 3.1 前向传播阶段. 4 3.2 反向传播阶段. 4 4. G 阅读全文

posted @ 2019-01-15 11:18 静悟生慧阅读(665) 评论(0) 推荐(0)

python opencv 按一定间隔截取视频帧

摘要：前言关于opencvOpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成，实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库阅读全文

posted @ 2019-01-11 18:17 静悟生慧阅读(6016) 评论(0) 推荐(1)

目标检测的标注数据 .xml 转为 tfrecord 的格式用于 TensorFlow 训练

摘要：将目标检测的标注数据 .xml 转为 tfrecord 的格式用于 TensorFlow 训练。 Python读取文件夹下图片的两种方法：参考： https://blog.csdn.net/CV_YOU/article/details/80778392 https://github.com/ra 阅读全文

posted @ 2019-01-09 17:26 静悟生慧阅读(3110) 评论(0) 推荐(0)

win10 标注工具LabelImg 安装使用

摘要：安装步骤（默认已经安装了Python3.X ）： pip 安装PyQt5 进入cmd（Win键 + R键，输入cmd，enter键入），输入： >>pip install PyQt5 如果下载太慢，就先下载安装用的wheel，地址，之后进入下载文件夹，执行 >>pip install PyQt5-5 阅读全文

posted @ 2019-01-09 15:39 静悟生慧阅读(2880) 评论(0) 推荐(0)

视频水印去除方法

摘要：从素材网站下载的视频大多都留有水印，使用这些视频对使用者有较大干扰，很不方便，需要运用一定的方法尽可能去掉。通过查阅资料，视频去水印有以下常见的几种方法：参考： https://github.com/ziweipolaris/watermark-removal https://github.co 阅读全文

posted @ 2019-01-07 11:49 静悟生慧阅读(2860) 评论(0) 推荐(1)

视频分类算法

摘要：一、传统视频分类方法深度学习兴起前，大多数视频分类都是基于手工设计的特征和典型的机器学习方法。比如：基于局部时空域的运动信息和表现信息，利用词袋模型等方式审核才能视频编码，然后利用视频编码来训练分类器（SVM）。这种基于人工设计特征的方法，如HOG、HOF、MBH 等特征，在经过词袋模型或Fis 阅读全文

posted @ 2018-12-26 17:29 静悟生慧阅读(4493) 评论(0) 推荐(0)

深度学习attention 机制了解

摘要：Attention是一种用于提升基于RNN（LSTM或GRU）的Encoder + Decoder模型的效果的的机制（Mechanism），一般称为Attention Mechanism。Attention Mechanism目前非常流行，广泛应用于机器翻译、语音识别、图像标注（Image Capt 阅读全文

posted @ 2018-12-12 15:02 静悟生慧阅读(1987) 评论(0) 推荐(0)

静悟生慧

随笔分类 - 图像处理

公告