米老虎M

神经网络的数学推导

摘要：注：在Cousera的DL课程中，设计矩阵和系数矩阵都是都是转置版本。我们采用这种描述。 $X$为转置的设计矩阵，维数是$n\times m$ $Z^{[1]}=W^{[1]}X+b^{[1]}$，维数是$h\times m$，h为隐藏层神经元数量 $A^{[1]}=\tanh(Z^{[1]})$，阅读全文

posted @ 2017-08-10 11:53 米老虎M 阅读(325) 评论(0) 推荐(0)

矩阵乘法的梯度计算

摘要：在神经网络中，我们经常要用到矩阵乘法，而BackProp过程中，要对系数矩阵的每一个元素求偏导数。这里来推导一下。我们假设有如下一个函数：$y=f(AB)$，其中 1、$A$是$n\times m$矩阵，$B$是$m\times k$矩阵。 2、f是一个标量函数，参数是一个矩阵。我们现在要求$\ 阅读全文

posted @ 2017-08-10 08:52 米老虎M 阅读(7092) 评论(1) 推荐(2)

深入理解设计矩阵(Design Matrix)

摘要：设计矩阵通常是用来描述数据集的一个方法。通常有m行n列， 1、每个行向量$\boldsymbol x^{(i)}$代表第$i$个实例 2、每个列向量$\boldsymbol x_j$代表第$j$个feature $X=\begin{bmatrix} \boldsymbol x_1 & \boldsy 阅读全文

posted @ 2017-08-09 16:34 米老虎M 阅读(7916) 评论(0) 推荐(0)

拉格朗日乘子

摘要：目标函数：最小化$f(x,y,z)=x^2+y^2+z^2$ 约束： $g_1(x,y,z)=x+y-2=0$ $g_2(x,y,z)=x+z-2=0$ 目标函数f在三维空间中的等值线是一个个球面。约束$g_1,g_2$在三维空间中分别是一个平面仅考虑一个约束：考虑$g_1$上任意一条轨迹线t，阅读全文

posted @ 2017-07-10 08:17 米老虎M 阅读(286) 评论(0) 推荐(0)

PRML中文版（马春鹏）勘误表

摘要：前言： PRML是严肃学习机器学习的首选教材。虽然内容略微陈旧，但是从写作水平来说，目前没有与之匹敌的其他读物。可惜我英语水平有限，原著读起来很容易疲劳，幸得网上流传的PRML中译版，整体流畅严谨，显然是译者在有相当理解的基础上翻译的。只是阅读的过程中偶有卡壳，结合英文版原著，发现有些小问题，这里都阅读全文

posted @ 2017-06-17 18:37 米老虎M 阅读(24269) 评论(5) 推荐(4)

增强学习笔记第三章马尔科夫决策过程

摘要： 3.1 概念： 1、学习者和决策者称为代理 2、代理以外称为环境。环境予以新状态，以及奖励 3、从状态到行动的概率的映射，称为策略。$\pi_t(s,a)$代表第t时刻在$s_t=s$时选择$a_t=a$的概率 4、定义环境和代理的边界，跟问题本身有关。所有不能直接控制的，通常都是环境。哪怕代理理解阅读全文

posted @ 2017-05-07 17:11 米老虎M 阅读(860) 评论(0) 推荐(0)

贝叶斯统计推断的阅读笔记

摘要：这里将MIT的《概率导论》关于贝叶斯统计推断的阐述总结一下。 1、问题描述：已知： (1)参数$\Theta$的先验分布$p_{\Theta}(\theta)$ (2)$\theta$给定的前提下，相关变量$X$的分布：$p_{X|\Theta}(x|\theta)$ (3)$X$的一系列观测样本阅读全文

posted @ 2017-03-27 12:36 米老虎M 阅读(1532) 评论(0) 推荐(0)

Kalman Filter的数学推导

摘要：前言关于Kalman Filter，有一篇很好的入门文章，建议先通读： Understanding the Basis of the Kalman Filter Via a Simple and Intuitive Derivation 不过这篇文章只推导了一元分布的情况，对多元分布的情况只是简单阅读全文

posted @ 2017-03-19 01:01 米老虎M 阅读(1010) 评论(0) 推荐(0)

线性代数随笔（二）：矩阵和向量乘法

摘要：一、矩阵和向量的乘积 $A\boldsymbol x=\left[ \begin{array}{cc}a _{1,1}&a_{1,2}\\a_{2,1}&a_{2,2} \end{array} \right]\left[ \begin{array}{cc}x_1\\x_2 \end{array} \ 阅读全文

posted @ 2017-03-10 14:29 米老虎M 阅读(1731) 评论(0) 推荐(0)

线性代数随笔（一）：线性变换，特征分解，二次型

摘要：一、一般线性变换 1、对于一个典型的线性变换： $y=A\boldsymbol x=\left[ \begin{array}{cc} \boldsymbol w_1 & \boldsymbol w_2\end{array} \right]\left[ \begin{array}{cc} x_1 \\ 阅读全文

posted @ 2017-03-10 11:21 米老虎M 阅读(3320) 评论(1) 推荐(1)

公告

导航