摘要: make_blobs会根据用户指定的特征数量、中心点数量、范围等来生成几类数据,这些数据可用于测试聚类算法的效果。 n_samples是待生成的样本数量,n_features是每个样本的特征数,centers是簇数量,也可以直接指定每个簇的中心点centers=[[-1,1],[1,2],[3,3] 阅读全文
posted @ 2019-04-17 21:42 zwtzz 阅读(2086) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/zy230530/p/7029025.html k-means算法中的k表示聚类为k个簇,means代表取每一个聚类中数据的均值作为该簇的中心(质心)即用每一个类的质心对该簇进行描述。k-means算法的原理比较简单,但它有缺陷,即其可能收敛到局部最优 阅读全文
posted @ 2019-04-17 20:25 zwtzz 阅读(2704) 评论(0) 推荐(0) 编辑
摘要: 监督学习:训练集的每一个数据已经有特征和标签,即有输入数据和输出数据,通过学习训练集中输入数据和输出数据的关系,生成合适的函数将输入映射到输出。比如分类、回归。 无监督学习:训练集的每一个数据都只有特征,即只有输入数据,算法需要学习训练集中的特征关系,进行建模,试图使类内差距最小、类间差距最大。比如 阅读全文
posted @ 2019-04-17 16:57 zwtzz 阅读(2208) 评论(0) 推荐(1) 编辑