机器学习 - 随笔分类 - topbookcc

机器学习-GBDT算法理解

摘要：GBDT GBDT(Gradient Boosting Decision Tree)，全名叫梯度提升决策树，使用的是Boosting的思想。 Boosting思想 Boosting方法训练基分类器时采用串行的方式，各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加，每一层在训练的时候，对前一层阅读全文

posted @ 2022-05-28 09:51 topbookcc 阅读(227) 评论(0) 推荐(0)

机器学习-L1和L2正则化理解

摘要：一. 正则化 1. 什么是正则化正则化(Regularization) 是机器学习中对原始损失函数引入额外信息（模型复杂度惩罚项），以便防止过拟合和提高模型泛化性能的一类方法的统称。也就是目标函数变成了原始损失函数+额外项. 常用的额外项一般有两种，英文称作$ℓ1−norm$和$ℓ2−norm$ 阅读全文

posted @ 2022-04-15 17:46 topbookcc 阅读(328) 评论(0) 推荐(0)

极大似然估计和最大后验概率估计

摘要：一、频率学派和贝叶斯派 1. 频率学派他们认为世界是确定的。也就是说事件在多次重复实验中趋于一个稳定的值p，这个值就是该事件的概率。参数估计方法-极大似然估计（MLE）特点：这种方法往往在大数据量的情况下可以很好的还原模型的真实情况。 2. 贝叶斯学派认为世界是不确定的，对世界先有一个预先的阅读全文

posted @ 2022-04-12 16:39 topbookcc 阅读(256) 评论(0) 推荐(0)

机器学习-生成模型 vs 判别模型

摘要：一. 判别模型由数据直接学习决策函数$f(X)$ 或者条件概率分布$p(Y|X)$作为预测模型，即判别模型。判别方法关系的是给定的输入 $X$ ，应该预测什么样的输出 $Y$。典型的判别模型包括：k近邻(knn)、感知机、逻辑斯蒂回归模型、最大熵模型、支持向量机、提升方法和条件随机场等。阅读全文

posted @ 2022-03-24 15:39 topbookcc 阅读(156) 评论(0) 推荐(0)

机器学习-bias and variance

摘要：0. Error(误差)、Bias(偏差)和Variance(方差) 模型性能度量误差期望值 1. bias与 Variance区别 bias: 度量了某种学习算法的平均估计结果所能逼近学习目标的程度；（一个高的偏差意味着一个坏的匹配） variance ：则度量了在面对同样规模的不同训练集时分散阅读全文

posted @ 2022-03-23 11:08 topbookcc 阅读(193) 评论(0) 推荐(0)

机器学习-逻辑回归

摘要：概述逻辑回归，也叫对数几率回归，它先回归出一个预测值，再用一个函数（sigmoid函数）把预测值转换为0 or 1类的概率从而实现分类。 Logistic回归之前说到 Logistic 回归主要用于分类问题，我们以二分类为例，对于所给数据集假设存在这样的一条直线可以将数据完成线性可分。阅读全文

posted @ 2022-03-12 20:41 topbookcc 阅读(52) 评论(0) 推荐(0)

机器学习-SVD[0]-线性可分

摘要：支持向量机线性可分 vs 线性不可分线性可分是否存在一条直线将两个类别分开数学定义向量定义思考参考文献 https://www.bilibili.com/video/BV1qf4y1x7kB?p=6 阅读全文

posted @ 2022-03-09 17:07 topbookcc 阅读(34) 评论(0) 推荐(0)

概率图模型

摘要：机器学习-概率图模型概率图含义概率图模型是用图来表示变量概率依赖关系的理论，结合概率论与图论的知识，利用图来表示与模型有关的变量的联合概率分布如果用一个词来形容概率图模型（Probabilistic Graphical Model）的话，那就是“优雅”。对于一个实际问题，我们希望能够挖掘隐含在阅读全文

posted @ 2021-10-25 15:03 topbookcc 阅读(362) 评论(0) 推荐(0)

topbookcc

随笔分类 - 机器学习

公告