3月份大数据分析预习
3月份预习
NumPy中最重要的一个特点就是其N维数组对象。
ndarray属性
:ndim:获取数组维度的个数、shape:获取数组的维度、size:获 取数组元素的总个数、dtype:获取描述数组中元素的类型、itemsie:获取数组 中每个元素的字节大小
创建NumPy数组
--创建一维数组:
data1 = np.array([1,2,3])
创建二维数组
:
data2 = np.array([[1,2,3],[4,5,6]])
zeros()
:创建元素值全是0的数组。
ones()
:函数创建元素值都为1的数组。
empty()
:函数创建一个新的数组,该数组只分配了内存空间,它里面填充的元素都是随机的。
arange()
:函数可以创建一个等差数组,返回的结果是数组
数组的运算
:矢量化运算:形成相同的数组、广播机制:形成不同的数组、数组与标量化运算:是标量
广播机制需要满足如下任意一个条件即可
:
(1)两个数组的某一维度等长。
(2)其中一个数组为一维数组。
广播机制需要扩展维度小的数组,使得它与维度最大的数组的shape值相同,以便使用元素级函数或者运算符进行运算。
ndarray的索引和切片:
arr[5]#获取索引为5的元素
arr[3:5]#获取索引为3~5的元素,但不包括5
arr[0,1]#获取位于第0行第1列的元素
array([False,False,True,False])#布尔型索引指的是将一个布尔数组作为数组索引,返回的数据是布尔数组中True对应位置的值。
数组的转置和轴对称
transpose()
:transpose()方法对数组的shape进行调换时,需要以元组的形式传入shape的编号
swapaxes()
:只需转换其中的两个轴,可以使用swapaxes()方法实现,但是该方法需要接受一对轴编号
sum()
:对数组中全部或者某个轴向的元素求和
mean()
:算术平均值
min()
:计算数组中的最小值
max()
:计算数组中的最大值
argmin()
:表示最小值的索引
argmax()
:表示最大值的索引
cumsum()
:表示所有元素的累计和
cumprod()
:表示所有元素的累计积
sort()
:对数组中的元素进行排序
all()
:用于判断整个数组中的元素的值是否全部满足条件,如果满足条件返回True,否则返回False
any()
:用于判断整个数组中的元素至少有一个满足条件就返回True,否则就返回False
unique()
:函数来找出数组中的唯一值,并返回排序后的有序结果
in1d()
:用于判断数组中的元素是否在另一个数组中存在,该函数返回的是一个布尔型的数组