摘要:
K-means聚类的原理。 K-Means算法的目标是将原始数据分为K簇,每一簇都有一个中心点,这也是簇中点的均值点,簇中所有的点到所属的簇的中心点的距离都比到其他簇的中心点更近。 K-means聚类的算法流程。 1、随机确定K个点作为质心。 2、找到离每个点最近的质心,将这个点分配到这个质心代表的 阅读全文
摘要:
写了一些使用sparksql以及spark机器学习来进行数据分析的东西,希望能给大家做一些参考 项目需求:对某大型商超客户采购数据集进行数据分析 数据来源:https://www.heywhale.com/mw/dataset/656069b19a74cc18269207c4/content 首先使 阅读全文