Pandas-数据探索

Pandas包对数据的常用探索功能,方便了解数据描述性属性。

目录

 


 

Pandas数据格式

  • Series
  • DataFrame:每个column就是一个Series

基础属性

  • shape
    • 返回行列数
  • index
  • columns
  • values
  • dtype/dtypes

 

汇总和计算描述统计

  • count()
  • value_counts()
    • 统计Series各值数量  
    • # 默认 sort = True
      s.value_counts()
      pd.value_counts(s,sort=False)
  • describe() 
    df.describe()
 
 ABCD
count 6.000000 6.000000 6.000000 6.000000
mean -0.465925 -0.146798 0.005445 -0.756245
std 0.841877 0.238644 1.389317 1.471563
min -1.587605 -0.456638 -2.072448 -2.840490
25% -0.786075 -0.306717 -0.649605 -1.528442
50% -0.729990 -0.144521 -0.021415 -0.816773
75% 0.090604 0.035111 0.848559 0.157414
max 0.692672 0.130688 1.868398 1.220088
  • head()
  • tail()
posted @ 2016-10-11 10:07  stream886  阅读(930)  评论(0编辑  收藏  举报