[Python学习笔记(二)] Pandas库基础学习——01

在 Python 中,可以用 Pandas 对数据做处理,以满足建模的需求

 

1、Pandas 的核心结构是 DataFrame ;

2、DataFrame.head(x) 返回 DataFrame 中前 x 行数据,也就是前 x 个样本,x参数的默认值为 5 ;

3、DataFrame.tail(x) 返回 DataFrame 中后 x 行数据,也就是后 x 个样本,x参数的默认值为 5 ;

4、DataFrame.columns 属性以类似 list 的结构返回 DataFrame 中的所有列名,也就是所有指标名;

5、DataFrame.shape 属性返回 DataFrame 实例的大小,也就是行和列的数量;

6、DataFrame.loc[0] 获取第一个样本的数据,此操作通过内置函数   loc[] 完成;

7、Pandas 中的数据类型:
  object     - For string values
  int           - For integer values
  float        - For float values
  datetime - For time values
  bool        - For Boolean values

8、DataFrame.dtypes 返回数据中各项指标的数据类型;

9、DataFrame.loc[x:y] 同样可以像 list 一样切片;

10、DataFrame [ column_name1 , column_name2 , column_name3 ] 可以获取这几列,也就是这几个指标的所有数据;

11、DataFrame.columns.tolist() 将 DataFrame 中所有列名以 list 格式返回;

12、可以将 11 中获得的 list 作为索引,输出 DataFrame 中这些列的数据;

13、跟 numpy 的 ndarray 一样,DataFrame 也可以作为一个整体进行 加减乘除 和 与或非 的运算操作;

14、两个维度一致的列做运算时,用对应位置的元素完成运算;

15、取列的最大值 DataFrame[ column_name ].max() 

posted on 2018-08-26 09:38  请叫我小鲤鱼  阅读(302)  评论(0编辑  收藏  举报