2019 年 8月 21 日随笔档案 - _Meditation

2019年8月21日

数据算法 --hadoop/spark数据处理技巧 --（11.K-均值聚类 12. k-近邻）

摘要：十一。k-均值聚类这个需要MR迭代多次。开始时，会选择K个点作为簇中心，这些点成为簇质心。可以选择很多方法啦初始化质心，其中一种方法是从n个点的样本中随机选择K个点。一旦选择了K个初始的簇质心，下面可以计算输入集合中各个点到这个k个中心点的距离，然后将各个点分配到与他距离最近的簇中心。所有对象都阅读全文

posted @ 2019-08-21 11:09 _Meditation 阅读(254) 评论(0) 推荐(0) 编辑

Meditation

埋滴忒深

公告