numpy数据集练习

#####

from sklearn.datasets import load_iris #在sklearn自带的数据集中导入鸢尾花load_iris数据集
data=load_iris()  #鸢尾花数据集赋值给data
print(data) #输出数据

运行结果1：

type(data)   #查看数据类型

运行结果2：

data.keys()
print(data.data[0])
print(data.data.shape)  #确定数据集大小
print(data.target)

运行结果3：

data_feature=data.feature_names
print(data_feature)
iris_data=data.data
print(iris_data)   #查看鸢尾花特征

运行结果4：

data_target=data.target_names
print(data_target)
iris_data=data.target #鸢尾花的类别

运行结果5：

type(iris_data)  #查看数据类型

运行结果6：

import numpy
sepal_length=numpy.array(list(len[0] for len in data['data']))
print(sepal_length) #取出花萼长度的数据

运行结果7：

petal_length=numpy.array(list(len[2]for len in data['data']))
print(petal_length)#取出花瓣长度数据

运行结果8：

petal_width=numpy.array(list(len[3]for len in data['data']))
print(petal_width)#取出花瓣宽度数据

运行结果9：

print(data.data[1])
print(data.target_names[1])#取出某朵花的四个特征及类别

运行结果10：

setosa_data = []
versicolor_data = []
virginica_data = []  #将所有花的特征和类别分成三组，每组50个
for i in range(0,150):
    if data.target[i] == 0:
        data1 = data.data[i].tolist()
        data1.append('setosa')
        setosa_data.append(data1)#生成setosa类的鸢尾花数据
    elif data.target[i] == 1:
        data1 = data.data[i].tolist()
        data1.append('versicolor')
        versicolor_data.append(data1)#生成versicolor类的鸢尾花数据
    else:
        data1 = data.data[i].tolist()
        data1.append('virginica')
        virginica_data.append(data1)#生成virginica类的鸢尾花数据类型
newdata=(setosa_data,versicolor_data,virginica_data)
print(newdata)#生成新的数组，每个元素包含四个特征+类别

运行结果11：

posted @ 2018-10-15 20:35 MISTanglijuan 阅读(489) 评论(0) 收藏举报

刷新页面返回顶部

MISTanglijuan

numpy数据集练习

公告