第4章 NumPy基础
NumPy是高性能科学计算和数据分析的基础包。
主要功能:
1、ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。
2、用于对整组数据进行快速运算的标准数学函数(无需编写循环)。
3、用于读写磁盘数据的工具以及用于操作内存映射文件的工具。
4、线性代数、随机数生成以及傅里叶变换功能。
5、用于集成由C、C++、Fortran等语言编写的代码的A C API。
ndarray:一种多维数组对象。ndarray是一个通用的同构数据多维容器(所有元素必须是相同类型的)。每个数组都有一个shape(一个表示各维度大小的元组)和一个dtype(一个用于说明数组数据类型的对象)
创建ndarray:
通过np.array()创建,例:arr1 = np .array(序列型对象)
嵌套序列将会被转化为一个多维数组。
其他创建方法:zeros和ones分别可以创建指定长度或形状的全0或全1数组。
empty可以创建一个没有任何具体值的数组。
NumPy默认数据类型是浮点型(float64)
ndarray的数据类型:
astype():将一个数组从一个dtype转换成另一个dtype。例:arr.asyupe(目标数据类型),浮点数转换为整数会舍去小数部分。
基本索引和切片:切片索引、布尔索引、花式索引(利用整数数组进行索引):花式索引跟切片不一样,它总是将数据复制到新数组中。
数组转置:转置是重塑的一种特殊形式,它返回的是源数据的视图(不会进行任何复制操作)。通过transpose方法、swapaxes方法和T属性进行行列转置。
通用函数:sqrt、exp、maximum(将两个数组中元素两两比较,返回最大的元素重新组成一个数组)、modf(返回浮点数组的小数和整数部分)
基本数组统计方法:
集合函数:
常用的线性代数函数:
随机函数: