数据分析包 - numpy
1. 创建
import numpy as np # 后面都用np表示numpy 1. a = np.array(列表)
2. a = np.zeros(10) # 创建长度为10,所有值为0.(默认为浮点型,可以将dtype='int'来改为整形)的一维数组
3. a = np.ones(10) # 值为1.0
4. a = np.empty(10) # 值是随机的
5. a = np.arrange(0,10,0.2) # 从0到10,步长0.2的一维数组,前包后不包
6. a = np.linspace(0, 10, 11) # 0到10(包含0和10),分成11个数
2. 数组(array)与列表的区别
1. 数组里面的元素类型必须一致
2. 数组的大小不可修改
3. 常用函数
arrayObj.dtype # 当前数组元素的数据类型 arrayObj.size # 元素个数 arrayObj.shape # 行数,列数
arrayObj.T # 行转为列,列转为行
4. 数组常用操作
1. 索引取值
a[0]
a[0][0] 或者a[0,0]
2. 切片
数组的切片,默认是引用原数组,修改切片中的值会将原数组的值也修改掉
列表的切片修改不会影响原列表
b = a[0:4].copy() 可以用.copy()的方法重新开启一块数组空间
二维切片
c = a[0:2,1:5] 逗号左边是行,右边是列
5. 条件过滤
1. a[a>5] 返回一个数组,。里面的所有元素都大于5
2. a[(a>5) & (a<10)] 返回一个数组,。里面的所有元素都大于5,且小于10。(&表示和的关系,|表示或的关系)
6. 特殊情况
1. nan = not a number 2. inf 比任何数都大
3. 函数:isnan, isinf