df.describe() 统计学
python数据清理方面一般都会用到df.describe()这个函数,但其实这是可以传参数的。比如以泰坦尼克号生存预测为例
df = pd.read_csv('./train.csv')
df.describe()
df.describe(include='O')
# 大写英文字母 O
df.describe(include='all')
可以看出默认是描述数字类型的属性,而include= “O“ 则是描述object类型的熟悉, include= ”all“则是对所有属性的描述。
以上,对于此函数大家还有什么发现,可以和我讨论哈。