有多少人工,就有多少智能
摘要: https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html?highlight=agg#sklearn.cluster.AgglomerativeClustering h 阅读全文
posted @ 2021-01-19 19:47 lvdongjie-avatarx 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 不管是GMM,还是k-means,都面临一个问题,就是k的个数如何选取?比如在bag-of-words模型中,用k-means训练码书,那么应该选取多少个码字呢?为了不在这个参数的选取上花费太多时间,可以考虑层次聚类。 假设有N个待聚类的样本,对于层次聚类来说,基本步骤就是: 1、(初始化)把每个样 阅读全文
posted @ 2021-01-19 19:30 lvdongjie-avatarx 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-01-19 19:03 lvdongjie-avatarx 阅读(127) 评论(0) 推荐(0) 编辑
摘要: https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html?highlight=kmeans#sklearn.cluster.KMeans https://scikit-learn.org/stable/ 阅读全文
posted @ 2021-01-19 08:19 lvdongjie-avatarx 阅读(154) 评论(0) 推荐(0) 编辑
摘要: K-means算法简述 K-means算法,也称为K-平均或者K-均值,一般作为掌握聚类算法的第一个算法。 这里的K为常数,需事先设定,通俗地说该算法是将没有标注的 M 个样本通过迭代的方式聚集成K个簇。 在对样本进行聚集的过程往往是以样本之间的距离作为指标来划分。 简单Demo说明如上图以 K 为 阅读全文
posted @ 2021-01-19 08:14 lvdongjie-avatarx 阅读(956) 评论(0) 推荐(0) 编辑
摘要: 由于 K-means 算法的分类结果会受到初始点的选取而有所区别,因此有提出这种算法的改进: K-means++ 。 算法步骤 其实这个算法也只是对初始点的选择有改进而已,其他步骤都一样。初始质心选取的基本思路就是,初始的聚类中心之间的相互距离要尽可能的远。 算法描述如下: 步骤一:随机选取一个样本 阅读全文
posted @ 2021-01-19 08:10 lvdongjie-avatarx 阅读(711) 评论(0) 推荐(0) 编辑
摘要: 1.K-Means(K均值)聚类 算法步骤:(1) 首先我们选择一些类/组,并随机初始化它们各自的中心点。中心点是与每个数据点向量长度相同的位置。这需要我们提前预知类的数量(即中心点的数量)。(2) 计算每个数据点到中心点的距离,数据点距离哪个中心点最近就划分到哪一类中。(3) 计算每一类中中心点作 阅读全文
posted @ 2021-01-19 07:33 lvdongjie-avatarx 阅读(551) 评论(0) 推荐(0) 编辑
摘要: 概述 CatBoost是俄罗斯的搜索巨头Yandex在2017年开源的机器学习库,是Boosting族算法的一种。CatBoost和XGBoost、LightGBM并称为GBDT的三大主流神器,都是在GBDT算法框架下的一种改进实现。XGBoost被广泛的应用于工业界,LightGBM有效的提升了G 阅读全文
posted @ 2021-01-18 07:56 lvdongjie-avatarx 阅读(349) 评论(0) 推荐(0) 编辑
摘要: LigthGBM是boosting集合模型中的新进成员,由微软提供,它和XGBoost一样是对GBDT的高效实现,原理上它和GBDT及XGBoost类似,都采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。 LightGBM在很多方面会比XGBoost表现的更为优秀。它有以下优势: 阅读全文
posted @ 2021-01-17 22:31 lvdongjie-avatarx 阅读(580) 评论(0) 推荐(0) 编辑
摘要: 前言 XGBoost是boosting算法的其中一种。Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。XGBoost是一种提升树模型,它是将许多树模型集成在一起,形成一个很强的分类器,所用到的树模型则是CART回归树模型。 CART CART回归树是假设树的结构为二叉树,通过不 阅读全文
posted @ 2021-01-17 10:45 lvdongjie-avatarx 阅读(215) 评论(0) 推荐(0) 编辑