2022 年 5月随笔档案 - 筷点雪糕侠

从n元文法到神经语言模型

摘要：资料来源 https://www.bilibili.com/video/BV11g4y1i7MW 80年代的n元语法隐马尔科夫模型 SVM MRF CRF 等等提纲 1.n元文法 2.神经语言模型 3.问题思考历史后面词的出现受前面词的影响，改进为条件概率，数据量太大改进，当前词只和前面n 阅读全文

posted @ 2022-05-29 21:08 筷点雪糕侠阅读(53) 评论(0) 推荐(0) 编辑

VAE-变分推断

摘要：1.推荐材料 1.PRML 第十章节变分推断 2.B站白板推导这部分讲解的很详细 https://www.bilibili.com/video/BV1aE411o7qd?p=70 https://www.bilibili.com/video/BV1aE411o7qd?p=71 https:// 阅读全文

posted @ 2022-05-22 08:37 筷点雪糕侠阅读(432) 评论(0) 推荐(0) 编辑

CNN-批归一化 BN batch normalization

摘要：1.批归一化的作用参看权值初始化那篇的内容，批归一化的主要意图和权值初始化是一样的，是要解决梯度的前向传播和反向传播过程中，梯度弥散，梯度消失的问题 2.批归一化的流程这里注意一点，BN层一般放在激活层前面 3.算法流程算法比较简单，解决问题的主要宗旨和权重初始化一样，尽量能勾勒出一个0均值，阅读全文

posted @ 2022-05-16 21:01 筷点雪糕侠阅读(161) 评论(0) 推荐(0) 编辑

CNN-权重参数初始化

摘要：原地址 https://www.bilibili.com/video/BV1ba411m72B 1.为什么需要对权重初始化精心设计 1.容易出现梯度消失(梯度特别的接近0)和梯度爆炸(梯度特别的大)的情况,导致大部分反向传播得到的梯度不起作用或者起反作用 2.设计思路神经网络的每层的数据的传送是要阅读全文

posted @ 2022-05-16 09:03 筷点雪糕侠阅读(688) 评论(0) 推荐(0) 编辑

CNN-计算过程

摘要：材料准备网络找了很多关于卷积神经网络的资料，综合来看，挑了一些比较有质量的材料汇总如下 1.鲁鹏老师的计算机视觉与深度学习 https://www.bilibili.com/video/BV1V54y1B7K3 2.邱锡鹏老师的蒲公英书 3.PRML关于卷积神经网络，不变性的章节(提供了一些不变性阅读全文

posted @ 2022-05-15 23:14 筷点雪糕侠阅读(315) 评论(0) 推荐(0) 编辑

常见激活函数,损失函数及其导数

摘要：1.sigmoid函数 2.softmax函数及其导数 3.tanh函数及其导数 3.MSE均方差损失函数及其导数 4.交叉熵损失函数及其导数阅读全文

posted @ 2022-05-08 22:39 筷点雪糕侠阅读(87) 评论(0) 推荐(0) 编辑

GBDT

摘要：#1.GBDT算法流程

设 有 训 练 集 : D a t a = {(x_{1}, y_{1}), (x_{2}, y_{2}), . . ., (x_{N}, y_{N})}, y_{i} \in {+ 1, - 1}

$设有训练集:Data=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\},y_i\in \{+1,-1\}$ 初始化弱学习器一般用所有训练样本的标签值的均值 \(f_0(x)=argmin_c\sum\limits_{i=1}^{N}L(y_i 阅读全文

posted @ 2022-05-03 21:39 筷点雪糕侠阅读(183) 评论(0) 推荐(0) 编辑

Adaboost

摘要：概述 Adaboost的思想是将关注点放在被错误分类的样本上，减小上一轮被正确分类的样本权值 Adaboost采用加权投票的方法，分类误差小的弱分类器的权重大，而分类误差大的弱分类器的权重小算法流程 1.

假 设 输 入 训 练 数 据 为

$假设输入训练数据为$ \(T=\{(x_1,y_1),(x_2,y_2),...,(x_ 阅读全文

posted @ 2022-05-03 16:21 筷点雪糕侠阅读(174) 评论(0) 推荐(0) 编辑

不动点法,收敛速度,二次终止性

摘要：方程求根方法 0.不动点迭代法

一 般 我 们 求 解 的 方 程 是

$一般我们求解的方程是$

f (x) = 0

$f(x)=0$

可 以 等 价 的 改 写 为

$可以等价的改写为$

x = ϕ (x)

$x=\phi(x)$

若 x^{*} 满 足 f (x^{*}) = 0, 则 亦 满 足 x^{*} = ϕ (x^{*}) ， 则 称 x^{*} 是 函 数 ϕ (x) 的 一 个 不 动 点

$若x^*满足f(x^*)=0,则亦满足x^*=\phi(x^*)，则称x^*是函数\phi(x)的一个不动点$ \(求f(x)的零点等价于求\phi(x)的阅读全文

posted @ 2022-05-02 21:47 筷点雪糕侠阅读(1571) 评论(0) 推荐(0) 编辑

凸集,凸函数,无约束优化问题

摘要：Hesse矩阵和Jacobi矩阵注意Hesse矩阵计算过程中目标变量是一元实值，自变量是向量，经过一阶导后变成目标变量为函数矩阵，自变量为向量函数，然后函数矩阵对向量求导，见书上定义 1.3.2 $$\nabla2f(x)=\begin{pmatrix} \frac{\partial2f(x)}{ 阅读全文

posted @ 2022-05-02 14:07 筷点雪糕侠阅读(145) 评论(0) 推荐(0) 编辑

期望,方差,协方差,协方差矩阵

摘要：1.期望定义

E (x) = \sum_{k = 1}^{\infty} x_{k} p_{k} - 离 散 型

$E(x)=\sum\limits_{k=1}^{\infty}x_kp_k-离散型$

E (x) = \int_{- \infty}^{+ \infty} x f (x) d x - 连 续 型

$E(x)=\int_{-\infty}^{+\infty}xf(x)dx-连续型$ 性质

E (C) = C, C 是 常 数

$E(C)=C,C是常数$

E (C X) = C E (X), C 是 常 数

$E(CX)=CE(X),C是常数$ \(E(X+Y)=E( 阅读全文

posted @ 2022-05-01 21:50 筷点雪糕侠阅读(234) 评论(0) 推荐(0) 编辑

常见分布

摘要：1.概念 cdf-累计分布函数 pdf-概率密度函数 Gamma函数 2.常见分布-离散型 0-1分布/伯努利分布随机变量X只可能有0，1两个值,S={0,1}，它的分布律是

P {X = k} = p^{k} (1 - p)^{1 - k}, k = 0, 1 (0 < p < 1)

$P\left\{X=k\right\} = p^k(1-p)^{1-k}, k=0,1 (0<p<1)$ \(或者\ 阅读全文

posted @ 2022-05-01 16:57 筷点雪糕侠阅读(258) 评论(0) 推荐(0) 编辑

矩阵微积分

摘要：1.函数矩阵定义

若 矩 阵 A = (a_{i j}) 的 所 有 元 素 a_{i j} 均 是 变 量 t 的 函 数 ， 则 A (t) 是 函 数 矩 阵

$若矩阵A=(a_{ij})的所有元素a_{ij}均是变量t的函数，则A(t)是函数矩阵$ $A(t)=\begin{pmatrix} a_{11}(t) & a_{12}(t) & ... \ ...\ a_{n1}(t) & a_{n2}(t) & ... & a_{nn 阅读全文

posted @ 2022-05-01 11:13 筷点雪糕侠阅读(462) 评论(0) 推荐(0) 编辑

筷点雪糕侠

05 2022 档案

公告

搜索

常用链接

随笔分类 (133)

随笔档案 (126)

阅读排行榜

评论排行榜

推荐排行榜

最新评论