from sklearn.datasets.samples_generator import make_blobs

make_blobs方法:

sklearn.datasets.make_blobs(n_samples=100,n_features=2,centers=3, cluster_std=1.0,center_box=(-10.0,10.0),shuffle=True,random_state=None)

make_blobs 函数是为聚类或分类产生数据集，产生一个数据集和相应的标签
n_samples: 表示数据样本点个数,默认值100
n_features: 是每个样本的特征（或属性）数，也表示数据的维度，默认值是2
centers: 表示类别数（标签的种类数），默认值3
cluster_std 表示每个类别的方差，例如我们希望生成2类数据，其中一类比另一类具有更大的方差，可以将cluster_std设置为[1.0,3.0]，浮点数或者浮点数序列，默认值1.0
center_box：中心确定之后的数据边界，默认值(-10.0, 10.0)
shuffle ：将数据进行洗乱，默认值是True
random_state: 官网解释是随机生成器的种子，可以固定生成的数据，给定数之后，每次生成的数据集就是固定的。若不给定值，则由于随机性将导致每次运行程序所获得的的结果可能有所不同。在使用数据生成器练习机器学习算法练习或python练习时建议给定数值。

以上转载于：https://www.cnblogs.com/qfwmy/p/12085357.html

posted @ 2023-09-24 19:12 emanlee 阅读(136) 评论(0) 收藏举报

刷新页面返回顶部