lvdongjie-avatarx

2021年1月19日

摘要： https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html?highlight=agg#sklearn.cluster.AgglomerativeClustering h 阅读全文

posted @ 2021-01-19 19:47 lvdongjie-avatarx 阅读(43) 评论(0) 推荐(0) 编辑

层次聚类 Hierarchical Clustering

摘要：不管是GMM，还是k-means，都面临一个问题，就是k的个数如何选取？比如在bag-of-words模型中，用k-means训练码书，那么应该选取多少个码字呢？为了不在这个参数的选取上花费太多时间，可以考虑层次聚类。假设有N个待聚类的样本，对于层次聚类来说，基本步骤就是： 1、（初始化）把每个样阅读全文

posted @ 2021-01-19 19:30 lvdongjie-avatarx 阅读(110) 评论(0) 推荐(0) 编辑

聚类常用衡量指标

摘要：阅读全文

posted @ 2021-01-19 19:03 lvdongjie-avatarx 阅读(127) 评论(0) 推荐(0) 编辑

sklearn- kmeans API

摘要： https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html?highlight=kmeans#sklearn.cluster.KMeans https://scikit-learn.org/stable/ 阅读全文

posted @ 2021-01-19 08:19 lvdongjie-avatarx 阅读(154) 评论(0) 推荐(0) 编辑

KMeans 算法

摘要： K-means算法简述 K-means算法，也称为K-平均或者K-均值，一般作为掌握聚类算法的第一个算法。这里的K为常数，需事先设定，通俗地说该算法是将没有标注的 M 个样本通过迭代的方式聚集成K个簇。在对样本进行聚集的过程往往是以样本之间的距离作为指标来划分。简单Demo说明如上图以 K 为阅读全文

posted @ 2021-01-19 08:14 lvdongjie-avatarx 阅读(956) 评论(0) 推荐(0) 编辑

K-means算法的改进：K-means++

摘要：由于 K-means 算法的分类结果会受到初始点的选取而有所区别，因此有提出这种算法的改进: K-means++ 。算法步骤其实这个算法也只是对初始点的选择有改进而已，其他步骤都一样。初始质心选取的基本思路就是，初始的聚类中心之间的相互距离要尽可能的远。算法描述如下：步骤一：随机选取一个样本阅读全文

posted @ 2021-01-19 08:10 lvdongjie-avatarx 阅读(711) 评论(0) 推荐(0) 编辑

六大聚类算法

摘要： 1.K-Means(K均值)聚类算法步骤：(1) 首先我们选择一些类/组，并随机初始化它们各自的中心点。中心点是与每个数据点向量长度相同的位置。这需要我们提前预知类的数量(即中心点的数量)。(2) 计算每个数据点到中心点的距离，数据点距离哪个中心点最近就划分到哪一类中。(3) 计算每一类中中心点作阅读全文

posted @ 2021-01-19 07:33 lvdongjie-avatarx 阅读(551) 评论(0) 推荐(0) 编辑

2021年1月18日

机器学习-集成学习-boosting-catboost原理

摘要：概述 CatBoost是俄罗斯的搜索巨头Yandex在2017年开源的机器学习库，是Boosting族算法的一种。CatBoost和XGBoost、LightGBM并称为GBDT的三大主流神器，都是在GBDT算法框架下的一种改进实现。XGBoost被广泛的应用于工业界，LightGBM有效的提升了G 阅读全文

posted @ 2021-01-18 07:56 lvdongjie-avatarx 阅读(349) 评论(0) 推荐(0) 编辑

2021年1月17日

机器学习-集成学习-Boosting-XgBoost提升算法之LightGBM

摘要： LigthGBM是boosting集合模型中的新进成员，由微软提供，它和XGBoost一样是对GBDT的高效实现，原理上它和GBDT及XGBoost类似，都采用损失函数的负梯度作为当前决策树的残差近似值，去拟合新的决策树。 LightGBM在很多方面会比XGBoost表现的更为优秀。它有以下优势：阅读全文

posted @ 2021-01-17 22:31 lvdongjie-avatarx 阅读(580) 评论(0) 推荐(0) 编辑

集成学习-Boosting-GBDT提升-XGBoost

摘要：前言 XGBoost是boosting算法的其中一种。Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。XGBoost是一种提升树模型，它是将许多树模型集成在一起，形成一个很强的分类器，所用到的树模型则是CART回归树模型。 CART CART回归树是假设树的结构为二叉树，通过不阅读全文

posted @ 2021-01-17 10:45 lvdongjie-avatarx 阅读(215) 评论(0) 推荐(0) 编辑

此博客专攻人工智能。

公告