摘要: 说明: KMeans 聚类中的超参数是 K,需要我们指定。K 值一方面可以结合具体业务来确定,另一方面可以通过肘方法来估计。K 参数的最优解是以成本函数最小化为目标,成本函数为各个类畸变程度之和,每个类的畸变程度等于该类重心与其内部成员位置距离的平方和但是平均畸变程度会随着K的增大先减小后增大,所以 阅读全文
posted @ 2019-12-19 17:53 赏尔 阅读(7586) 评论(0) 推荐(0) 编辑
摘要: sklearn.datasets.make_blobs() 是用于创建多类单标签数据集的函数,它为每个类分配一个或多个正态分布的点集。 sklearn.datasets.make_blobs( n_samples=100, # 待生成的样本的总数 n_features=2, # 每个样本的特征数 c 阅读全文
posted @ 2019-12-19 16:23 赏尔 阅读(2690) 评论(0) 推荐(0) 编辑