代码改变世界

随笔档案-2019年06月

梯度消失和ReLU

2019-06-27 20:12 by heixialee, 1652 阅读, 收藏,
摘要: 两个方面:1. 网络太深,链式法制传导(每次的相乘的数据都小于1),导致梯度消失。 2. sigmoid, tanh函数的导数趋向于0,导致梯度消失。 当然weight的初始化数据也有很大影响 This is the fourth entry in my journey to extend my k 阅读全文

focal loss

2019-06-27 16:35 by heixialee, 686 阅读, 收藏,
摘要: 论文:Focal Loss for Dense Object Detection 论文链接:https://arxiv.org/abs/1708.02002 回到顶部 一. 提出背景 object detection的算法主要可以分为两大类:two-stage detector和one-stage 阅读全文

CNN的理解

2019-06-27 11:44 by heixialee, 499 阅读, 收藏,
摘要: CNN最成功的应用是在CV,那为什么NLP和Speech的很多问题也可以用CNN解出来?为什么AlphaGo里也用了CNN?这几个不相关的问题的相似性在哪里?CNN通过什么手段抓住了这个共性? Deep Learning -Yann LeCun, Yoshua Bengio & Geoffrey H 阅读全文

1x1卷积的作用

2019-06-27 11:27 by heixialee, 1432 阅读, 收藏,
摘要: One by One [ 1 x 1 ] Convolution - counter-intuitively useful Whenever I discuss or show GoogleNet architecture, one question always comes up - "Why 1 阅读全文

动态规划

2019-06-26 17:01 by heixialee, 372 阅读, 收藏,
摘要: 作者:阮行止链接:https://www.zhihu.com/question/23995189/answer/613096905来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 0. intro 很有意思的问题。以往见过许多教材,对动态规划(DP)的引入属于“奉天承运 阅读全文

孪生网络跟踪

2019-06-21 14:58 by heixialee, 426 阅读, 收藏,
摘要: github: https://github.com/foolwood/DaSiamRPN paper: https://arxiv.org/pdf/1808.06048.pdf http://openaccess.thecvf.com/content_cvpr_2018/papers/Li_Hig 阅读全文

最大似然函数

2019-06-20 10:40 by heixialee, 5972 阅读, 收藏,
摘要: 概率函数 vs 似然函数 : p(x|θ) (概率函数是θ,已知,求x的概率。似然函数是x已知,求θ) 分布是p(x|θ)的总体样本中抽取到这100个样本的概率,也就是样本集X中各个样本的联合概率 最大似然估计为: 为了方便计算,对联合概率取对数 求最大似然函数估计值的一般步骤: (1)写出似然函数 阅读全文