2018年1月29日

摘要: squeeze 压缩维度为1的numpy向量 argmax 获取最大值的下标 np.random.shuffle(index) reshape是从低维度到高维度。max,sum等函数都是注意axis,不选择就是全体计算。 swapaxes 转换轴,将两个选择的轴对调,在CNN中X乘W有的时候需要拉伸 阅读全文
posted @ 2018-01-29 20:14 猪的饲养员 阅读(164) 评论(0) 推荐(0) 编辑
摘要: CNN实现 概述 我在qwe中有两种,第一种是按照Ng课程中的写法,多层循环嵌套得到每次的“小方格”,然后WX+b,这样的做法是最简单,直观。但是效率极其慢。基本跑个10张以内图片都会卡的要死。 第二种方法是使用img2col,将其转换为对应的矩阵,然后直接做一次矩阵乘法运算。 先看第一种 对于m, 阅读全文
posted @ 2018-01-29 19:33 猪的饲养员 阅读(900) 评论(0) 推荐(0) 编辑
摘要: qwe "github地址" 简介 简单的深度框架,参考Ng的深度学习课程作业,使用了keras的API设计。 方便了解网络具体实现,避免深陷于成熟框架的细节和一些晦涩的优化代码。 网络层实现了Dense, Flatten, Convolution2D, Activation, Dropout等。 阅读全文
posted @ 2018-01-29 09:47 猪的饲养员 阅读(602) 评论(0) 推荐(0) 编辑
摘要: 初始化有三点个要求, 一个是不能有对称性,比如全为0.这样的反向传播对每一个单元学习到的结果都一样。没有区分度学习不到东西。 另一个要求是避免落入激活函数饱和区,导致梯度学习太慢。 第三点对于深度网络中的每一层,它们的输出方差应该尽量相同,满足学习到的目标分布和原始分布一致(那我们将其都转换到均值0 阅读全文
posted @ 2018-01-29 09:35 猪的饲养员 阅读(157) 评论(0) 推荐(0) 编辑

导航