pandas

Pandas: numpy处理的是数值型数据,pandas可以帮助处理除了数值型数据外的数据(字符串,时间序列)

Pandas模块常用的两个类:Series, DataFrame

Series是一种类似于一维数组的对象,由values:一组数据(ndarray类型) 和 index: 相当于数据索引标签。 其创建 可以通过列表、numpy数组、字典完成。

DataFrame是一个【表格型】的数据结构。DataFrame由按照一定顺序排列的多列数据组成,设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引,也有列索引。 行索引:index, 列索引:columns, 值:values。其创建可以通过ndarray 、字典完成

1.1 series 创建

1.2 series 属性

1.3 series 常用方法

1.4 series 索引和切片

 

2.1 DataFrame 创建

2.2 DataFrame 属性

2.3 DataFrame 方法

2.4 DataFrame 索引和切片

 

1.1 创建Series

 

1.2 Series 属性 .shape\ .size\ .dtype\ .index\ .values

 

 1.3 Series 常用方法 .head()\ .tail()\ .unique()\ .isnull()\ .notnull()\ .add()\ .sub()\ .mul()\ .div()

 

 

 

 

 series算数运算:索引一致的元素进行运算否则补空

 

   

 

 

 

 1.4 Series索引和切片

 

 

 

 2.1 DataFrame 创建

 

 

 

 

   

 

  

 

 

 2.2 DataFrame 属性 .values\ .columns\ .index\ .shape\ .size

 

 

 2.3 DataFrame 索引和切片

 

  

 

 

 

  • iloc:
    • 通过隐式索引取行
  • loc:
    • 通过显示索引取行, 支持逻辑索引

  

 

   

 

   

 

   

  

  

 

 

   

 

   

 

    

 

 

   

 

 

   

 

posted @ 2021-02-04 23:40  正在学Python  阅读(99)  评论(0编辑  收藏  举报