随笔档案「2019年6月」 - heixialee

梯度消失和ReLU

2019-06-27 20:12 by heixialee, 1652 阅读, 收藏,

摘要：两个方面：1. 网络太深，链式法制传导(每次的相乘的数据都小于1)，导致梯度消失。 2. sigmoid, tanh函数的导数趋向于0，导致梯度消失。当然weight的初始化数据也有很大影响 This is the fourth entry in my journey to extend my k 阅读全文

0 Comment

focal loss

2019-06-27 16:35 by heixialee, 686 阅读, 收藏,

摘要：论文：Focal Loss for Dense Object Detection 论文链接：https://arxiv.org/abs/1708.02002 回到顶部一. 提出背景 object detection的算法主要可以分为两大类：two-stage detector和one-stage 阅读全文

0 Comment

CNN的理解

2019-06-27 11:44 by heixialee, 499 阅读, 收藏,

摘要： CNN最成功的应用是在CV，那为什么NLP和Speech的很多问题也可以用CNN解出来？为什么AlphaGo里也用了CNN？这几个不相关的问题的相似性在哪里？CNN通过什么手段抓住了这个共性？ Deep Learning -Yann LeCun, Yoshua Bengio & Geoffrey H 阅读全文

0 Comment

1x1卷积的作用

2019-06-27 11:27 by heixialee, 1432 阅读, 收藏,

摘要： One by One [ 1 x 1 ] Convolution - counter-intuitively useful Whenever I discuss or show GoogleNet architecture, one question always comes up - "Why 1 阅读全文

0 Comment

动态规划

2019-06-26 17:01 by heixialee, 372 阅读, 收藏,

摘要：作者：阮行止链接：https://www.zhihu.com/question/23995189/answer/613096905来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。 0. intro 很有意思的问题。以往见过许多教材，对动态规划（DP）的引入属于“奉天承运阅读全文

0 Comment

孪生网络跟踪

2019-06-21 14:58 by heixialee, 426 阅读, 收藏,

摘要： github: https://github.com/foolwood/DaSiamRPN paper: https://arxiv.org/pdf/1808.06048.pdf http://openaccess.thecvf.com/content_cvpr_2018/papers/Li_Hig 阅读全文

0 Comment

最大似然函数

2019-06-20 10:40 by heixialee, 5972 阅读, 收藏,

摘要：概率函数 vs 似然函数 : p(x|θ) (概率函数是θ，已知，求x的概率。似然函数是x已知，求θ) 分布是p(x|θ)的总体样本中抽取到这100个样本的概率，也就是样本集X中各个样本的联合概率最大似然估计为：为了方便计算，对联合概率取对数求最大似然函数估计值的一般步骤：（1）写出似然函数阅读全文

0 Comment

heixialee

随笔档案-2019年06月