对数据进行简单探索, 获取洞见
比如获取了pandas数据df
1、快速浏览数据 df.head()
2、了解数据信息
df.info(),df.describe() —— 哪些列,各列中缺少多少数据.etc
3、数据可视化
df.hist()绘制柱状图, 还可以绘制散点图
4、相关性分析
df.corr(),皮尔逊矩阵
5、简单计算, 对列进行计算,如log压缩, 对列与列之间进行计算等等