numpy数据集练习
#####
from sklearn.datasets import load_iris #在sklearn自带的数据集中导入鸢尾花load_iris数据集 data=load_iris() #鸢尾花数据集赋值给data print(data) #输出数据
运行结果1:
type(data) #查看数据类型
运行结果2:
data.keys() print(data.data[0]) print(data.data.shape) #确定数据集大小 print(data.target)
运行结果3:
data_feature=data.feature_names print(data_feature) iris_data=data.data print(iris_data) #查看鸢尾花特征
运行结果4:
data_target=data.target_names print(data_target) iris_data=data.target #鸢尾花的类别
运行结果5:
type(iris_data) #查看数据类型
运行结果6:
import numpy sepal_length=numpy.array(list(len[0] for len in data['data'])) print(sepal_length) #取出花萼长度的数据
运行结果7:
petal_length=numpy.array(list(len[2]for len in data['data'])) print(petal_length)#取出花瓣长度数据
运行结果8:
petal_width=numpy.array(list(len[3]for len in data['data'])) print(petal_width)#取出花瓣宽度数据
运行结果9:
print(data.data[1]) print(data.target_names[1])#取出某朵花的四个特征及类别
运行结果10:
setosa_data = [] versicolor_data = [] virginica_data = [] #将所有花的特征和类别分成三组,每组50个 for i in range(0,150): if data.target[i] == 0: data1 = data.data[i].tolist() data1.append('setosa') setosa_data.append(data1)#生成setosa类的鸢尾花数据 elif data.target[i] == 1: data1 = data.data[i].tolist() data1.append('versicolor') versicolor_data.append(data1)#生成versicolor类的鸢尾花数据 else: data1 = data.data[i].tolist() data1.append('virginica') virginica_data.append(data1)#生成virginica类的鸢尾花数据类型 newdata=(setosa_data,versicolor_data,virginica_data) print(newdata)#生成新的数组,每个元素包含四个特征+类别
运行结果11: