k-means 非监督学习聚类算法

非监督学习

非监督学习没有历史样本数据和标签，直接对数据分析或得结果。

k-means 使用

>>> from sklearn.cluster import KMeans
>>> import numpy as np
>>> X = np.array([[1, 2], [1, 4], [1, 0],
...               [4, 2], [4, 4], [4, 0]])
>>> kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
>>> kmeans.labels_
array([0, 0, 0, 1, 1, 1], dtype=int32)
>>> kmeans.predict([[0, 0], [4, 4]])
array([0, 1], dtype=int32)
>>> kmeans.cluster_centers_
array([[ 1.,  2.],
       [ 4.,  2.]])

k-means重要参数

n_clusters 估计聚类的数量
n_init k-means算法基于不同中心点运行的次数
max_tier k-means一次运行的迭代次数，默认300，通常不到300就结束了

posted @ 2017-11-30 10:01 james.yj 阅读(416) 评论(0) 收藏举报

刷新页面返回顶部