10.11作业
numpy数据集练习(10.11)
1.安装scipy,numpy,sklearn包
2. 从sklearn包自带的数据集中读出鸢尾花数据集data
3.查看data类型,包含哪些数据
import numpy from sklearn.datasets import load_iris data = load_iris() print('数据类型:',type(data)) print('数据包含内容:',data.keys())
运行结果:
4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
iris_feature = data['feature_names'],data['data'] print('鸢尾花数据:',iris_feature) iris_target = data.target,data.target_names print('鸢尾花形状类型:',iris_target)
运行结果:
5.取出所有花的花萼长度(cm)的数据
iris_len = numpy.array(list(len[0] for len in data['data']))#取出所有花的花萼长度(cm)的数据 print('所有花萼长度:',sepal_length)
6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
iris_length = numpy.array(list(len[2] for len in data['data'])) #取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据 iris_length.resize(5,30) iris_width = numpy.array(list(len[3] for len in data['data'])) iris_width.resize(5,30) iris_len_wid = (iris_length,iris_width) print('所有花的花瓣长宽:',iris_len_wid)
运行结果:
7.取出某朵花的四个特征及其类别。
print('第一朵花特征:',data['data'][0]) #取出某朵花的四个特征及其类别。 print('第一朵花类别:',data['target'][0])
运行结果:
8.将所有花的特征和类别分成三组,每组50个
9.生成新的数组,每个元素包含四个特征+类别
iris_setosa = [] #定义三个新列表用于存放数据 iris_versicolor = [] iris_virginica = [] for i in range(0,150):#用for循环分类,并把target为0和1分别放入setosa类型和versicolor存放 if data['target'][i] == 0: data1 = data['data'][i].tolist() data1.append('setosa') iris_setosa.append(data1) elif data['target'][i] == 1: data1 = data['data'][i].tolist() data1.append('versicolor') iris_versicolor.append(data1) else: data1 = data['data'][i].tolist() data1.append('virginica') iris_virginica.append(data1 data2 = (iris_setosa,iris_versicolor,iris_virginica)#生成新的数组,每个元素包含四个特征+类别 print('新数组分类结果:',data2)
运行结果: