随笔分类 - 机器学习
机器学习学习
摘要:逻辑回归 逻辑回归是用来解决分类问题的 分类问题 二分类 就是将两类物体分开 多分类 每次只分类出一类物体,有n个物体,则需要做n-1次二分类 sigmoid 函数 选择sigmoid函数的原因 线性回归的函数 ℎ 𝑥 = 𝑧 = 𝑤𝑇𝑥,范围是(−∞, +∞)。 而分类预测结果需要得到[
阅读全文
摘要:拉格朗日乘数法 拉格朗日乘数法 KKT条件 互补松弛条件的解释 实例 对偶问题 SVM的对偶问题求解
阅读全文
摘要:支持向量机 SVM 算法思想概述 背景知识 间隔最大化 间隔 定义 7.2 求解最大间隔 方法1 转化为凸函数求解 算法7.1 输入: 线性可分训练数据集 ,其中$x_i \in \mathcal{X}=R
阅读全文
摘要:GAN 的后序 参考资料 网络博客 令人拍案叫绝的Wasserstein GAN - 知乎 (zhihu.com) 生成式对抗网络GAN有哪些最新的发展,可以实际应用到哪些场景中? - 知乎 (zhihu.com) 从动力学角度看优化算法:GAN的第三个阶段 - 知乎 (zhihu.com) 视频讲
阅读全文
摘要:我在b站读研究生——跟着李沐读论文1 ——Gan 读论文 标题+作者+时间+期刊+被引 generative adversarial Nets 生成对抗网络 作者 Ian J.Goodfellow 深度学习(花书)的作者 摘要 Abstract 我们推出了一个通过对抗过程来估计生成模型的新的结构,在
阅读全文
摘要:广义线性模型GLM 判断标准非常简单,响应变量y独立则GLM,否则GLMM。这就是最本质的判断标准,其它的标准都是基于这个标准来的 指数分布族 概率密度为 其
阅读全文
摘要:熵 ,KL散度,交叉熵,JS散度,Wasserstein 距离(EarthMover距离) 信息量 香农(Shannon)认为“信息是用来消除随机不确定性的东西”,也就是说衡量一个事件信息量大小就看这个信息消除事件不确定性的程度。 从编码的角度 设信源X可发出的消息符号集合为$A= { a_i |
阅读全文
摘要:最大似然估计 一 基本知识 1 .1概率理解——贝叶斯派与频率派 频率派:概率是一个确定的值,模型中的参数也是一个确定的值。样本数据是由确定的概率分布生成的,因此数据是随机的。多次重复试验,使用事件发生的频率近似代替概率 。 对于一个模型或者也可说一个分布中的参数,我们相信它是固定不变的,是固有的属
阅读全文
摘要:线性回归 符号约定 : 算法流程 理解 使用训练数据来找到线性回归方程中的参数使得回归方程的预测值和真实值的误差最小。 这个误差可以使用 平方衡量 ,也可以使用 绝对值 等方式衡量。 寻找的过程可以直接解优化方程,也可以使用迭代法不断更新。 求解 目标函数 :$
阅读全文
摘要:决策树 机器学习,西瓜书p80 表4.2 使用信息增益生成决策树及后剪枝
阅读全文
摘要:模式识别(Pattern Recognition) 第一章 概论 概论 模式识别(Pattern Recognition) 用计算机实现人对各种事物或现象的分析,描述,判断,识别。 发展史 1929年 G. Tauschek发明阅读机 ,能够阅读0-9的数字。 30年代 Fisher提出统计分类理论
阅读全文