numpy数据集练习

 

 #####

from sklearn.datasets import load_iris #在sklearn自带的数据集中导入鸢尾花load_iris数据集
data=load_iris()  #鸢尾花数据集赋值给data
print(data) #输出数据

运行结果1:

 

type(data)   #查看数据类型

 运行结果2:

data.keys()
print(data.data[0])
print(data.data.shape)  #确定数据集大小
print(data.target)

 运行结果3:

data_feature=data.feature_names
print(data_feature)
iris_data=data.data
print(iris_data)   #查看鸢尾花特征

 运行结果4:

 

data_target=data.target_names
print(data_target)
iris_data=data.target #鸢尾花的类别

 运行结果5:

type(iris_data)  #查看数据类型

运行结果6:

 

import numpy
sepal_length=numpy.array(list(len[0] for len in data['data']))
print(sepal_length) #取出花萼长度的数据

 运行结果7:

petal_length=numpy.array(list(len[2]for len in data['data']))
print(petal_length)#取出花瓣长度数据

运行结果8:

petal_width=numpy.array(list(len[3]for len in data['data']))
print(petal_width)#取出花瓣宽度数据

 运行结果9:

print(data.data[1])
print(data.target_names[1])#取出某朵花的四个特征及类别

 运行结果10:

setosa_data = []
versicolor_data = []
virginica_data = []  #将所有花的特征和类别分成三组,每组50个
for i in range(0,150):
    if data.target[i] == 0:
        data1 = data.data[i].tolist()
        data1.append('setosa')
        setosa_data.append(data1)#生成setosa类的鸢尾花数据
    elif data.target[i] == 1:
        data1 = data.data[i].tolist()
        data1.append('versicolor')
        versicolor_data.append(data1)#生成versicolor类的鸢尾花数据
    else:
        data1 = data.data[i].tolist()
        data1.append('virginica')
        virginica_data.append(data1)#生成virginica类的鸢尾花数据类型
newdata=(setosa_data,versicolor_data,virginica_data)
print(newdata)#生成新的数组,每个元素包含四个特征+类别

 运行结果11:

posted @ 2018-10-15 20:35  MISTanglijuan  阅读(468)  评论(0编辑  收藏  举报