随笔分类 - 图像处理
摘要:mmdetection 详细解读:https://blog.csdn.net/syysyf99/article/details/96574325 简介faster_rcnn_r50_fpn_1x.py配置文件cascade_rcnn_r50_fpn_1x.py配置文件 一、简介在使用mmdetect
阅读全文
摘要:原文:https://blog.csdn.net/robinzhou/article/details/6960345 当需要将一张有透明部分的图片粘贴到一张底片上时,如果用Python处理,可能会用到PIL,但是PIL中 有说明,在粘贴RGBA模式的图片是,alpha通道不会被帖上,也就是不会有透明
阅读全文
摘要:图片不清晰,需要指定dpi,图片保存大小问题,设置bbox_inches=‘tight’ (bbox_inches:可选bbox英寸。只保存图形的给定部分。如果“紧”,试着找出数字的紧框。如果没有,请使用savefig.bbox) https://blog.csdn.net/qq_31648921/
阅读全文
摘要:需要在线读条码、二维码? 可以试试Dynamsoft的免费在线条码解码工具。 https://demo.dynamsoft.com/DBR/BarcodeReaderDemo.aspx 这个条码扫描应用程序用了Dynamsoft barcode Reader SDK,解码准确度高,速度快,可以解出各
阅读全文
摘要:https://www.cnblogs.com/luofeel/p/9150968.html 边缘检测,霍夫变换 http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/imgproc/imgtrans/hough_lines/houg
阅读全文
摘要:这是文档中的函数原型 cv2.resize(src, dsize[, dst[, fx[, fy[, interpolation]]]]) 参数说明src:要resize的原图,应该是一个矩阵 dsize:希望得到图像的shape,是一个tuple类型的数据,注意,这里是宽*高,而我们平常img.s
阅读全文
摘要:本文链接:https://blog.csdn.net/ling_xiobai/article/details/79691785今天使用opencv运行一个脚本,但是出现cv2.cv.BoxPoints()函数有错,提示’module’ object has no attribute ‘cv’ 的错误
阅读全文
摘要:安装及详细使用方法介绍: https://blog.csdn.net/qq_38451119/article/details/82428612 pip install imgaug 失败解决方法: 提示Command "python setup.py egg_info" failed with er
阅读全文
摘要:行人重识别综述: https://zhuanlan.zhihu.com/p/26168232 一个强力的ReID basemodel https://zhuanlan.zhihu.com/p/40514536 CVPR2018 ReID论文简评 https://zhuanlan.zhihu.com/
阅读全文
摘要:前言:最近学习了一些OCR相关的基础知识,包含目标检测和自然语言处理。 正好,在数字中国有相关的比赛: https://www.datafountain.cn/competitions/334/details/rule 所以想动手实践一下,实际中发现,对于数据标签的处理和整个检测和识别的流程并不熟悉
阅读全文
摘要:因为要处理一些医学图像,需要把dcm格式的文件转换成jpg格式。本来用Sante DICOM Editor用得挺好的,方便查看dcm文件,但是在转换上每次只能转一张(本人没有找到用该软件批量转格式的方法)。于是在网上搜集了各种软件(图片格式转换大师、DCM图片转换大师等等),要么是要付费的,要么就是
阅读全文
摘要:单个汉字书法识别经验: https://cloud.tencent.com/developer/article/1142927 文化传承—汉字书法多场景识别 https://www.datafountain.cn/competitions/334/details/rank?sch=1420&page
阅读全文
摘要:.dcm文件是DICOM(Digital Imaging and Communications in Medicine)即医学数字成像和通信中记录医学图像和相关信息的文件,在用于医学图像处理的时候我们需要将·.dcm文件中的图像信息读取到python程序中来,下面展示了一个简单的示例。 安装pydi
阅读全文
摘要:https://blog.csdn.net/a312863063/article/details/83512870 目 录第一章 初步了解GANs 3 1. 生成模型与判别模型. 3 2. 对抗网络思想. 3 3. 详细实现过程. 3 3.1 前向传播阶段. 4 3.2 反向传播阶段. 4 4. G
阅读全文
摘要:前言关于opencvOpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库
阅读全文
摘要:将目标检测 的标注数据 .xml 转为 tfrecord 的格式用于 TensorFlow 训练。 Python读取文件夹下图片的两种方法: 参考: https://blog.csdn.net/CV_YOU/article/details/80778392 https://github.com/ra
阅读全文
摘要:安装步骤(默认已经安装了Python3.X ): pip 安装PyQt5 进入cmd(Win键 + R键,输入cmd,enter键入),输入: >>pip install PyQt5 如果下载太慢,就先下载安装用的wheel,地址,之后进入下载文件夹,执行 >>pip install PyQt5-5
阅读全文
摘要:从素材网站下载的视频大多都留有水印,使用这些视频对使用者有较大干扰,很不方便,需要运用一定的方法尽可能去掉。 通过查阅资料,视频去水印有以下常见的几种方法: 参考: https://github.com/ziweipolaris/watermark-removal https://github.co
阅读全文
摘要:一、传统视频分类方法 深度学习兴起前,大多数视频分类都是基于手工设计的特征和典型的机器学习方法。 比如:基于局部时空域的运动信息和表现信息,利用词袋模型等方式审核才能视频编码,然后利用视频编码来训练分类器(SVM)。这种基于人工设计特征的方法,如HOG、HOF、MBH 等特征,在经过词袋模型或Fis
阅读全文
摘要:Attention是一种用于提升基于RNN(LSTM或GRU)的Encoder + Decoder模型的效果的的机制(Mechanism),一般称为Attention Mechanism。Attention Mechanism目前非常流行,广泛应用于机器翻译、语音识别、图像标注(Image Capt
阅读全文