摘要: VOC数据集的标注文件都是xml格式,最近需要频繁处理xml文件的读取和更新,整理下python处理xml文件的方法。 XML 指可扩展标记语言(eXtensible Markup Language), 被设计用来传输和存储数据。python中有三个模块解析xml文件:DOM, ElementTre 阅读全文
posted @ 2020-04-07 23:50 silence_cho 阅读(19362) 评论(0) 推荐(1) 编辑
摘要: 收藏些图像处理,机器学习,深度学习方面比较不错的文章,时常学习,复习和膜拜吧。。。 图像方面(传统CV): 1. SIFT特征 https://www.cnblogs.com/wangguchangqing/p/4853263.html http://shartoo.github.io/SIFT-f 阅读全文
posted @ 2019-10-24 23:20 silence_cho 阅读(1164) 评论(0) 推荐(0) 编辑
摘要: 目标检测模型主要分为two-stage和one-stage, one-stage的代表主要是yolo系列和ssd。简单记录下学习yolo系列的笔记。 1 yolo V1 yolo v1是2015年的论文 you only look once:unified,real-time object dete 阅读全文
posted @ 2019-10-23 22:49 silence_cho 阅读(4978) 评论(0) 推荐(1) 编辑
摘要: 自己搭建神经网络时,一般都采用已有的网络模型,在其基础上进行修改。从2012年的AlexNet出现,如今已经出现许多优秀的网络模型,如下图所示。 主要有三个发展方向: Deeper:网络层数更深,代表网络VggNet Module: 采用模块化的网络结构(Inception),代表网络GoogleN 阅读全文
posted @ 2019-10-08 22:16 silence_cho 阅读(50835) 评论(4) 推荐(15) 编辑
摘要: 对于深度学习的网络模型,希望其速度快,内存小,精度高。因此需要量化指标来评价这些性能,常用的指标有:mAP(平均准确度均值,精度指标), FPS(每秒处理的图片数量或每张图片处理需要时间,同样硬件条件下的速度指标) , 模型参数大小(内存大小指标)。 1.mAP (mean Avearage Pre 阅读全文
posted @ 2019-10-03 17:54 silence_cho 阅读(7013) 评论(0) 推荐(0) 编辑
摘要: 在神经网络训练时,还涉及到一些tricks,如网络权重的初始化方法,优化器种类(权重更新),图片预处理等,继续填坑。 1. 神经网络初始化(Network Initialization ) 1.1 初始化原因 我们构建好网络,开始训练前,不能默认的将所有权重系数都初始化为零,因为所有卷积核的系数都相 阅读全文
posted @ 2019-10-02 21:53 silence_cho 阅读(2627) 评论(0) 推荐(0) 编辑
摘要: 神经网络中还有一些激活函数,池化函数,正则化和归一化函数等。需要详细看看,啃一啃吧。。 1. 激活函数 1.1 激活函数作用 在生物的神经传导中,神经元接受多个神经的输入电位,当电位超过一定值时,该神经元激活,输出一个变换后的神经电位值。而在神经网络的设计中引入了这一概念,来增强神经网络的非线性能力 阅读全文
posted @ 2019-09-26 22:44 silence_cho 阅读(2946) 评论(0) 推荐(1) 编辑
摘要: 在炼丹师的路上越走越远,开始入手pytorch框架的学习,越炼越熟吧。。。 1. 张量的创建和操作 创建为初始化矩阵,并初始化 a = torch.empty(5, 3) #创建一个5*3的未初始化矩阵 nn.init.zeros_(a) #初始化a为0 nn.init.constant_(a, 3 阅读全文
posted @ 2019-09-19 20:41 silence_cho 阅读(9538) 评论(1) 推荐(2) 编辑
摘要: 最近开始刷lintcode,记录下自己的答案,数字即为lintcode题目号,语言为python3,坚持日拱一卒吧。。。 (一). 回文字符窜问题(Palindrome problem) 627. Longest Palindrome 给出一个包含大小写字母的字符串。求出由这些字母构成的最长的回文串 阅读全文
posted @ 2019-07-27 16:09 silence_cho 阅读(3895) 评论(0) 推荐(0) 编辑
摘要: 通过阈值化分割可以得到二值图,但往往会出现图像中物体形态不完整,变的残缺,可以通过形态学处理,使其变得丰满,或者去除掉多余的像素。常用的形态学处理算法包括:腐蚀,膨胀,开运算,闭运算,形态学梯度,顶帽运算和底帽运算。 1. 腐蚀 腐蚀操作类似于中值平滑,也有一个核,但不进行卷积运算,而是取核中像素值 阅读全文
posted @ 2019-06-22 18:32 silence_cho 阅读(21832) 评论(4) 推荐(4) 编辑