随笔分类 -  图像处理

摘要:mmdetection 详细解读:https://blog.csdn.net/syysyf99/article/details/96574325 简介faster_rcnn_r50_fpn_1x.py配置文件cascade_rcnn_r50_fpn_1x.py配置文件 一、简介在使用mmdetect 阅读全文
posted @ 2020-01-15 15:18 静悟生慧 阅读(9605) 评论(0) 推荐(2) 编辑
摘要:原文:https://blog.csdn.net/robinzhou/article/details/6960345 当需要将一张有透明部分的图片粘贴到一张底片上时,如果用Python处理,可能会用到PIL,但是PIL中 有说明,在粘贴RGBA模式的图片是,alpha通道不会被帖上,也就是不会有透明 阅读全文
posted @ 2019-12-25 16:19 静悟生慧 阅读(2391) 评论(0) 推荐(0) 编辑
摘要:图片不清晰,需要指定dpi,图片保存大小问题,设置bbox_inches=‘tight’ (bbox_inches:可选bbox英寸。只保存图形的给定部分。如果“紧”,试着找出数字的紧框。如果没有,请使用savefig.bbox) https://blog.csdn.net/qq_31648921/ 阅读全文
posted @ 2019-12-24 15:07 静悟生慧 阅读(8863) 评论(0) 推荐(0) 编辑
摘要:需要在线读条码、二维码? 可以试试Dynamsoft的免费在线条码解码工具。 https://demo.dynamsoft.com/DBR/BarcodeReaderDemo.aspx 这个条码扫描应用程序用了Dynamsoft barcode Reader SDK,解码准确度高,速度快,可以解出各 阅读全文
posted @ 2019-12-13 11:55 静悟生慧 阅读(1388) 评论(0) 推荐(0) 编辑
摘要:https://www.cnblogs.com/luofeel/p/9150968.html 边缘检测,霍夫变换 http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/imgproc/imgtrans/hough_lines/houg 阅读全文
posted @ 2019-12-12 21:35 静悟生慧 阅读(775) 评论(0) 推荐(0) 编辑
摘要:这是文档中的函数原型 cv2.resize(src, dsize[, dst[, fx[, fy[, interpolation]]]]) 参数说明src:要resize的原图,应该是一个矩阵 dsize:希望得到图像的shape,是一个tuple类型的数据,注意,这里是宽*高,而我们平常img.s 阅读全文
posted @ 2019-11-29 14:20 静悟生慧 阅读(1790) 评论(0) 推荐(0) 编辑
摘要:本文链接:https://blog.csdn.net/ling_xiobai/article/details/79691785今天使用opencv运行一个脚本,但是出现cv2.cv.BoxPoints()函数有错,提示’module’ object has no attribute ‘cv’ 的错误 阅读全文
posted @ 2019-11-29 12:17 静悟生慧 阅读(1237) 评论(0) 推荐(0) 编辑
摘要:安装及详细使用方法介绍: https://blog.csdn.net/qq_38451119/article/details/82428612 pip install imgaug 失败解决方法: 提示Command "python setup.py egg_info" failed with er 阅读全文
posted @ 2019-06-04 15:31 静悟生慧 阅读(973) 评论(0) 推荐(0) 编辑
摘要:行人重识别综述: https://zhuanlan.zhihu.com/p/26168232 一个强力的ReID basemodel https://zhuanlan.zhihu.com/p/40514536 CVPR2018 ReID论文简评 https://zhuanlan.zhihu.com/ 阅读全文
posted @ 2019-03-05 17:16 静悟生慧 阅读(1666) 评论(0) 推荐(0) 编辑
摘要:前言:最近学习了一些OCR相关的基础知识,包含目标检测和自然语言处理。 正好,在数字中国有相关的比赛: https://www.datafountain.cn/competitions/334/details/rule 所以想动手实践一下,实际中发现,对于数据标签的处理和整个检测和识别的流程并不熟悉 阅读全文
posted @ 2019-02-22 20:33 静悟生慧 阅读(3105) 评论(0) 推荐(0) 编辑
摘要:因为要处理一些医学图像,需要把dcm格式的文件转换成jpg格式。本来用Sante DICOM Editor用得挺好的,方便查看dcm文件,但是在转换上每次只能转一张(本人没有找到用该软件批量转格式的方法)。于是在网上搜集了各种软件(图片格式转换大师、DCM图片转换大师等等),要么是要付费的,要么就是 阅读全文
posted @ 2019-02-15 20:58 静悟生慧 阅读(3814) 评论(0) 推荐(0) 编辑
摘要:单个汉字书法识别经验: https://cloud.tencent.com/developer/article/1142927 文化传承—汉字书法多场景识别 https://www.datafountain.cn/competitions/334/details/rank?sch=1420&page 阅读全文
posted @ 2019-02-14 09:29 静悟生慧 阅读(1745) 评论(0) 推荐(0) 编辑
摘要:.dcm文件是DICOM(Digital Imaging and Communications in Medicine)即医学数字成像和通信中记录医学图像和相关信息的文件,在用于医学图像处理的时候我们需要将·.dcm文件中的图像信息读取到python程序中来,下面展示了一个简单的示例。 安装pydi 阅读全文
posted @ 2019-02-13 15:37 静悟生慧 阅读(7258) 评论(0) 推荐(0) 编辑
摘要:https://blog.csdn.net/a312863063/article/details/83512870 目 录第一章 初步了解GANs 3 1. 生成模型与判别模型. 3 2. 对抗网络思想. 3 3. 详细实现过程. 3 3.1 前向传播阶段. 4 3.2 反向传播阶段. 4 4. G 阅读全文
posted @ 2019-01-15 11:18 静悟生慧 阅读(654) 评论(0) 推荐(0) 编辑
摘要:前言关于opencvOpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库  阅读全文
posted @ 2019-01-11 18:17 静悟生慧 阅读(5914) 评论(0) 推荐(1) 编辑
摘要:将目标检测 的标注数据 .xml 转为 tfrecord 的格式用于 TensorFlow 训练。 Python读取文件夹下图片的两种方法: 参考: https://blog.csdn.net/CV_YOU/article/details/80778392 https://github.com/ra 阅读全文
posted @ 2019-01-09 17:26 静悟生慧 阅读(3092) 评论(0) 推荐(0) 编辑
摘要:安装步骤(默认已经安装了Python3.X ): pip 安装PyQt5 进入cmd(Win键 + R键,输入cmd,enter键入),输入: >>pip install PyQt5 如果下载太慢,就先下载安装用的wheel,地址,之后进入下载文件夹,执行 >>pip install PyQt5-5 阅读全文
posted @ 2019-01-09 15:39 静悟生慧 阅读(2783) 评论(0) 推荐(0) 编辑
摘要:从素材网站下载的视频大多都留有水印,使用这些视频对使用者有较大干扰,很不方便,需要运用一定的方法尽可能去掉。 通过查阅资料,视频去水印有以下常见的几种方法: 参考: https://github.com/ziweipolaris/watermark-removal https://github.co 阅读全文
posted @ 2019-01-07 11:49 静悟生慧 阅读(2770) 评论(0) 推荐(1) 编辑
摘要:一、传统视频分类方法 深度学习兴起前,大多数视频分类都是基于手工设计的特征和典型的机器学习方法。 比如:基于局部时空域的运动信息和表现信息,利用词袋模型等方式审核才能视频编码,然后利用视频编码来训练分类器(SVM)。这种基于人工设计特征的方法,如HOG、HOF、MBH 等特征,在经过词袋模型或Fis 阅读全文
posted @ 2018-12-26 17:29 静悟生慧 阅读(4354) 评论(0) 推荐(0) 编辑
摘要:Attention是一种用于提升基于RNN(LSTM或GRU)的Encoder + Decoder模型的效果的的机制(Mechanism),一般称为Attention Mechanism。Attention Mechanism目前非常流行,广泛应用于机器翻译、语音识别、图像标注(Image Capt 阅读全文
posted @ 2018-12-12 15:02 静悟生慧 阅读(1909) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示