二、Pandas基础:DataFrame

一、DataFrame简介

  • 一个表型格数的、据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。

二、DataFrame创建

  • DataFrame可以使用数组,列表和字典等方式进行创建
  • 当DataFrame数组和列表创建时,可指定参数index(行索引)和columns(列索引),如果不指定,默认用0的列表为序列号
  • 创建后的DataFrame,亦可修改行列参数

三、DataFrame查询

DataFrame可以直接通过列索引名,查看或修改整列值

如果想通过行索引名查询的话,需要借助ix('行索引名')

四、数据过滤

  • dropna:丢弃(删除)有NaN的行, 可以通过阈值(how参数)的调节对缺失值的容忍度
  • fillna:用指定值或者插值的方式填充缺失数据,比如: ffill或者bfill
  • isnull:返回一个含有布尔值的对象,这些布尔值表示那些值是缺失值NA
  • notnull:返回布尔值对象,非空位为True

 

五、DataFrame运算

DataFrame也保留了大量Numpy的运算机制,它们在DataFrame中均可以使用。

DataFrame中默认是按照列索引进行计算的,如果要按照行索引计算,需要在方法后面设置维度参数axis=1

 

posted @   小小逐月者  阅读(856)  评论(0编辑  收藏  举报
努力加载评论中...
点击右上角即可分享
微信分享提示