10.11作业

numpy数据集练习(10.11)

 

1.安装scipy,numpy,sklearn包

2. 从sklearn包自带的数据集中读出鸢尾花数据集data

3.查看data类型,包含哪些数据

import numpy
from sklearn.datasets import load_iris    
data = load_iris()
print('数据类型:',type(data))
print('数据包含内容:',data.keys())

运行结果:

4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型

iris_feature = data['feature_names'],data['data']
print('鸢尾花数据:',iris_feature)
iris_target = data.target,data.target_names
print('鸢尾花形状类型:',iris_target)

运行结果:

 

5.取出所有花的花萼长度(cm)的数据

iris_len = numpy.array(list(len[0] for len in data['data']))#取出所有花的花萼长度(cm)的数据
print('所有花萼长度:',sepal_length)

 

6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

iris_length = numpy.array(list(len[2] for len in data['data'])) #取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
iris_length.resize(5,30)
iris_width = numpy.array(list(len[3] for len in data['data']))
iris_width.resize(5,30)
iris_len_wid = (iris_length,iris_width)
print('所有花的花瓣长宽:',iris_len_wid)

运行结果:

 

7.取出某朵花的四个特征及其类别。

print('第一朵花特征:',data['data'][0]) #取出某朵花的四个特征及其类别。
print('第一朵花类别:',data['target'][0])

运行结果:

8.将所有花的特征和类别分成三组,每组50个

9.生成新的数组,每个元素包含四个特征+类别

iris_setosa = []      #定义三个新列表用于存放数据
iris_versicolor = []
iris_virginica = []

for i in range(0,150):#用for循环分类,并把target为0和1分别放入setosa类型和versicolor存放
    if  data['target'][i] == 0:  
        data1 = data['data'][i].tolist()
        data1.append('setosa')
        iris_setosa.append(data1)
    elif data['target'][i] == 1:  
        data1 = data['data'][i].tolist()
        data1.append('versicolor')
        iris_versicolor.append(data1)
    else:                          
        data1 = data['data'][i].tolist()
        data1.append('virginica')
        iris_virginica.append(data1

data2 = (iris_setosa,iris_versicolor,iris_virginica)#生成新的数组,每个元素包含四个特征+类别
print('新数组分类结果:',data2)

运行结果:

 

posted @ 2018-10-14 13:37  郑裕莹  阅读(130)  评论(0编辑  收藏  举报