数据分析三剑客之numpy
import numpy as np
一、创建ndarray
两种方式:
1、使用np.array()
2、使用np的routines函数创建
1 np.ones(shape,dtype=None,order='C') # 1 填充 2 np.zeros(shape,dtype=None,order='C') # 0 填充 3 np.full(shape,fill_value,dtype=None,order='C') #fill_value 填充 4 5 np.linspace(start,stop,num=n) #等差数列 n个 6 np.arange(satrt,stop,step,dtype=None) 7 np.random.random(size=None) #样本为[0,1)的随机数 8 np.random.randn(d0,d1,d2...,dn) #样本为标准正态分布 9 np.random.randint(low,high,size=None,dtype='I')
二、ndarray属性
ndim:维度
shape:形状
size:总长度
dtype:元素类型
三、ndarray基本操作
1、索引
2、切片
3、变形 arr.reshape()
4、级联(纬度相同,形状相符)
np.concatenate((arr1,arr2,..),axis=1)
axis=1 表示行方向
axis=0 表示列方向
5、切分
np.split(arr,行或列号,垂直于那个轴)
如:np.split(arr,(2,4),axis=1) 表示在2,4列各切一次
6、副本 copy()
如:arr_c = arr.copy()
四、聚合操作
常用:
1、求和 np.sum()
2、最大最小值 np.max()/np.min()
3、平均值 np.mean()
4、标准差 np.std()
五、广播机制
规则:缺失维度的数组将维度补充为进行运算的数组的维度,缺失的数组元素使用已有的元素进行填充
也就是三点:1、为缺失的维度补1;
2、缺失元素用已有元素补充
3、缺失的数组只能有一行或一列
六、ndarray的排序
np.sort() #不改变输入
ndarray.sort() #本地处理,会改变输入