机器学习 - 随笔分类 - 做梦当财神

机器学习-目录

摘要：机器学习-泛化能力的评价指标机器学习-感知机机器学习-k 近邻法机器学习-朴素贝叶斯法机器学习-逻辑回归机器学习-最大熵模型机器学习-主成分分析（PCA）机器学习-决策树决策树-ID3、C4.5 决策树-CART 分类树决策树-CART 回归树决策树后剪枝机器学习-支持向量机阅读全文

posted @ 2022-05-23 11:03 做梦当财神阅读(239) 评论(0) 推荐(0)

sklearn.ensemble.VotingClassifier

摘要：中文文档：Voting Classifier 1. Voting Classifier 原理 $Voting\ Classifier$ 即用于分类的投票机制，分为硬投票和软投票。 voting = 'hard'：硬投票。表示预测的类标签进行多数投票决定。 voting = 'soft'：软投票。阅读全文

posted @ 2022-05-12 15:04 做梦当财神阅读(1134) 评论(0) 推荐(0)

sklearn.model_selection.GridSearchCV

摘要：$sklearn$ 官网中的 GridSearchCV。机器学习模型中，需要人工选择的参数称为超参数。 $GridSearchCV$ 可以拆分为两部分$GridSearch、CV$，即网格搜索、交叉验证。$GridSearch$ 是一种调参手段，穷举搜索，即在所有候选的参数中，通过循环阅读全文

posted @ 2022-05-05 14:37 做梦当财神阅读(312) 评论(0) 推荐(0)

Ridge、Lasso、ElasticNet 回归

摘要：线性回归中，提到线性回归的 $L2$ 正则化（$Ridge$ 回归），以及线性回归的 $L1$ 正则化（$Lasso$ 回归）. 1. 线性回归线性回归的矩阵形式： \[ \pmb{h_\theta X = X \theta} \] 极小化损失函数： \[ \pmb{L(\thet 阅读全文

posted @ 2022-05-04 19:37 做梦当财神阅读(403) 评论(0) 推荐(0)

支持向量机（四）SMO算法

摘要：支持向量机（一）线性可分支持向量机支持向量机（二）线性支持向量机支持向量机（三）非线性支持向量机与核函数支持向量机（四）SMO算法序列最小最优化（$sequential\ minimal\ optimization,SMO$）算法是 $SVM$ 的快速实现算法。 $SMO$ 算法阅读全文

posted @ 2022-03-15 16:24 做梦当财神阅读(194) 评论(0) 推荐(0)

指数加权移动平均法（EWMA）

摘要：1. 概述加权移动平均法，是对观察值分别给予不同的权数，按不同的权数求得移动平均值。并以最后的移动平均值为基础，确定预测值的方法。采用加权移动平均法，是因为观察期的近期观察值对预测有较大影响，它更能反映近期变化的趋势。指数加权移动平均法（Exponentially Weighted Moving 阅读全文

posted @ 2021-07-01 13:28 做梦当财神阅读(3395) 评论(0) 推荐(0)

Apriori 算法

摘要：Apriori算法用来找出频繁出现的数据集合。 1. 频繁项集的评估标准常用的频繁项集的评估标准有支持度、置信度、提升度三个。支持度：几个关联数据在数据集中出现的次数占总数据集的比重。或者说几个关联数据出现的概率。比如两个想分析关联性的数据X和Y，则支持度为：以此类推，三个想分析关联性的数据阅读全文

posted @ 2021-06-10 08:52 做梦当财神阅读(1066) 评论(0) 推荐(0)

sklearn.preprocessing.OneHotEncoder

摘要：1.概要 sklearn.preprocessing.OneHotEncoder，将类别变量、顺序变量转化为二值化的标志变量。 2. 解析格式： OneHotEncoder(n_values=’auto’, categorical_features=’all’, dtype=<class ‘num 阅读全文

posted @ 2021-05-17 17:42 做梦当财神阅读(1500) 评论(0) 推荐(0)

朴素贝叶斯法

摘要：朴素贝叶斯（Nave Bayes）法是基于贝叶斯定理与特征条件独立假设的分类算法。它的思想可以概括为先验概率+数据=后验概率。 1.朴素贝叶斯模型下面是分类模型样本：假设有m个样本，每个样本有n个特征，特征输出有K个类别，定义为从样本得到朴素贝叶斯的先验分布，接着得到条件概率分布，然后用贝阅读全文

posted @ 2021-04-18 12:54 做梦当财神阅读(370) 评论(0) 推荐(0)

机器学习中生成式模型 VS 判别式模型

摘要：1. 前言判别式模型：只有一个模型，把测试数据往里一丢，结果就出来了。如 SVM。生成式模型：有多个模型（一般有多少类就有多少个），把测试数据丢到各个模型里面，最后比较结果，选择最优的最为结果。如朴素贝叶斯。 2.基本概念判别模型，就是判别（数据输出量）的模型。生成模型，就是生成（数据的分阅读全文

posted @ 2021-04-18 09:10 做梦当财神阅读(395) 评论(0) 推荐(0)

cross_val_score

摘要：交叉检验原理使用交叉检验最简单的方法是在估计器上调用cross_val_score函数。下面示例展示如何通过分割数据，拟合模型和计算连续5次的分数（每次不同分割）来估计linear Kernel支持向量机在iris数据集上的精度： from sklearn.model_selection imp 阅读全文

posted @ 2020-07-27 17:28 做梦当财神阅读(5165) 评论(0) 推荐(0)

sklearn.pipeline.Pileline

摘要：1. sklearn中的Pipeline机制管道机制在机器学习算法中的应用：参数集在新数据集（比如测试集）上的重复使用。管道机制实现流式化封装和管理。 2. 加载数据集并拆分 import pandas as pd from sklearn.pipeline import Pipeline fr 阅读全文

posted @ 2020-07-23 12:19 做梦当财神阅读(299) 评论(0) 推荐(0)

密度聚类（DBSCAN）

摘要：DBSCAN是密度聚类算法，和K-Means，BIRCH只适用于凸样本集的聚类相比，DBSCAN既适用于凸样本集，也适用于非凸样本集。 1. 密度聚类原理 DBSCAN算法指类别可通过样本分布的紧密程度决定。即同一类别的样本紧密相连，也就是说在该类别的不远处一定有同类别的样本。 2. DBSCAN密阅读全文

posted @ 2020-07-23 11:24 做梦当财神阅读(875) 评论(0) 推荐(0)

特征选择（2）

摘要：特征选择（1）在sklearn.feature_selection模块中，可以对样本集进行特征选择（feature selection）和降维（dimensionality reduction）,这样会提高估计器的准确度或者增强在高维数据集上的性能。 1. 移除低方差特征 VarianceThre 阅读全文

posted @ 2020-07-22 23:10 做梦当财神阅读(357) 评论(0) 推荐(0)

提升树

摘要：集成学习随机森林 AdaBoost 算法提升树梯度提升树（GBDT） XGBoost 一、提升树提升树是以 $CART$ 回归树为基本分类器的提升方法。提升方法采用加法模型（即基函数的线性组合）与前向分步算法。 1. 提升树模型提升树模型可以表示为决策树的加法模型： $$ \tag{13 阅读全文

posted @ 2020-07-02 18:51 做梦当财神阅读(811) 评论(0) 推荐(0)

XGBoost

摘要：集成学习 Bagging 与随机森林 Boosting 与 AdaBoost 算法提升树梯度提升树（GBDT） XGBoost 目录一、XGBoost 简介二、XGBoost 原理1. 从目标函数开始，生成一棵树1.1 学习第 t 颗树1.2 XGBoost 的目标函数1.3 泰勒公式展开1.4 阅读全文

posted @ 2020-06-08 00:33 做梦当财神阅读(555) 评论(0) 推荐(0)

AdaBoost 算法

摘要：集成学习随机森林 AdaBoost 算法提升树梯度提升树（GBDT） XGBoost 在 $Boosting$ 系列算法中，最具代表的是 $AdaBoost$ 算法。该算法即可用于分类，也可用于回归。一、AdaBoost 分类算法假设二分类训练集 \[ T=\{(x_1,y_1), 阅读全文

posted @ 2019-08-14 11:05 做梦当财神阅读(536) 评论(1) 推荐(0)

梯度提升树(GBDT)

摘要：集成学习随机森林 AdaBoost 算法提升树梯度提升树（GBDT） XGBoost $GBDT$ 有很多简称，有 $GBT\ (Gradient\ Boosting\ Tree)$、$GTB\ (Gradient\ Tree\ Boosting)$、$GBRT\ (Gradient\ Boo 阅读全文

posted @ 2019-08-14 11:05 做梦当财神阅读(789) 评论(1) 推荐(0)

支持向量机（三）非线性支持向量机与核函数

摘要：支持向量机（一）线性可分支持向量机支持向量机（二）线性支持向量机支持向量机（三）非线性支持向量机与核函数支持向量机（四）SMO算法一、核技巧 1.非线性分类问题如图 $7.7$，无法用直线（线性模型）将正实例点 “●”、负实例点 “×” 正确分开，但可用一条椭圆曲线（非线性模型）将其分阅读全文

posted @ 2019-07-16 11:08 做梦当财神阅读(1156) 评论(0) 推荐(0)

sklearn.feature_extraction.DictVectorizer

摘要：sklearn.feature_extraction.DictVectorizer：将字典组成的列表转换成向量。(将特征与值的映射字典组成的列表转换成向量) 1. 特征矩阵行代表数据，列代表特征，0表示该数据没有该特征 [[ 2. 0. 1.] [ 0. 1. 3.]] [[ 2. 0. 1.] [ 阅读全文

posted @ 2019-07-09 15:44 做梦当财神阅读(992) 评论(0) 推荐(1)

做梦当财神

随笔分类 - 机器学习

公告