pandas
Pandas: numpy处理的是数值型数据,pandas可以帮助处理除了数值型数据外的数据(字符串,时间序列)
Pandas模块常用的两个类:Series, DataFrame
Series是一种类似于一维数组的对象,由values:一组数据(ndarray类型) 和 index: 相当于数据索引标签。 其创建 可以通过列表、numpy数组、字典完成。
DataFrame是一个【表格型】的数据结构。DataFrame由按照一定顺序排列的多列数据组成,设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引,也有列索引。 行索引:index, 列索引:columns, 值:values。其创建可以通过ndarray 、字典完成
1.2 Series 属性 .shape\ .size\ .dtype\ .index\ .values
1.3 Series 常用方法 .head()\ .tail()\ .unique()\ .isnull()\ .notnull()\ .add()\ .sub()\ .mul()\ .div()
series算数运算:索引一致的元素进行运算否则补空
2.2 DataFrame 属性 .values\ .columns\ .index\ .shape\ .size
- iloc:
- 通过隐式索引取行
- loc:
- 通过显示索引取行, 支持逻辑索引