sakitam!

导航

numpy数据集练习

 

(1)安装scipy,numpy,sklearn包

(2)从sklearn包自带的数据集中读出鸢尾花数据集data

(3)查看data类型,包含哪些数据

#加载numpy包
import numpy
#加载sklearn包
from sklearn.datasets import load_iris 
#读出鸢尾花数据集data
data=load_iris()
#查看data类型
print(type(data))
#查看数据内容
print(data.keys())

运行结果:

(4)取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型

#鸢尾花的四个特征#
data_feature= data.feature_names
iris_data=data.data
print(data_feature)
print(iris_data)
#鸢尾花的三个类别#
data_target =data.target_names
print(data_target)
iris_data=data.target
print(iris_data)
#数据类型#
type(iris_data)

运行结果:

(5)取出所有花的花萼长度(cm)的数据

#鸢尾花花萼长度的数据#
sepal_length=numpy.array(list(len[0] for len in data['data']))
print(sepal_length)

运行结果:

(6)取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

#所有花花瓣的长度#
data_petal_l=[x[2] for x in data['data']]
#所有花花瓣的宽度#
data_petal_w=[x[3] for x in data['data']]
#所有花花瓣的长度和宽度
data_petal_l_w=np.array([data_petal_l,data_petal_w])

运行结果:

(7)取出某朵花的四个特征和类别

(8)将所有花分成三个组,每组50个

(9)生成新的元祖,每组包括特征和类别

#(7)某朵花的四个特征和类别#
data_flower=(data['data'][0],data['target_names'][0])
data_flower
#(8)定义三个列表来存放不同类型花朵的类别#
data_setosa=[]  #存放类为0的花朵
data_versicolor=[] #存放类为1的花朵
data_virginica=[] #存放类为2的花朵
len(data['data'])
for i in  range(0,150):
    if data['target'][i]==0:#类别为setosa
        datas=data['data'][i].tolist()
        datas.append('setosa')
        print(data_setosa.append(datas))
    elif data['target'][i]==1:#类别为versicolor
        datas=data['data'][i].tolist()
        datas.append('versicolor')
        data_versicolor.append(datas)
    else:
        datas=data['data'][i].tolist()#类别为virginica
        datas.append('virginica')
        data_virginica.append(datas)
#(9)形成新的数组来存放三个类别的花朵#
new_data=(np.array([data_setosa,data_versicolor,data_virginica]))
print(new_data)

运行结果:

 

 

posted on 2018-10-14 13:40  sakitam!  阅读(128)  评论(0编辑  收藏  举报