基于seaborn的pandas-DataFrame数据可视化
seaborn是基于DataFrame级的可视化。 matplotlib就是seaborn的底层。
1 import matplotlib.pyplot as plt 2 import numpy as np 3 import pandas as pd 4 import seaborn as sns 5 sns.set() #引入seaborn的set()方法设置样式,比纯用matplotlib要多了一些东西如图底的格子纹,图例和线条的变化。 6 rng = np.random.RandomState(0) 7 x = np.linspace(0, 10, 500) 8 y = np.cumsum(rng.randn(500, 6), 0) 9 plt.plot(x, y) 10 plt.legend('ABCDEF', ncol=2, loc='upper left')
进行统计数据可视化时, 我们通常想要的就是频次直方图和多变量的联合分布图。
还可以用 KDE 获取变量分布的平滑估计,Seaborn 通过 sns.kdeplot 实现。
用 sns.jointplot 可以同时看到两个变量的联合分布与单变量的独立分布。
对多维数据集进行可视化时, 最终都要使用矩阵图(pairplot) 。 如果想画出所有变量中任意两个变量之间的图形, 用矩阵
图探索多维数据不同维度间的相关性非常有效。直接用 sns.pairplot 即可。也可以用 sns.jointplot 画出不同数据集的联合分布和各数据本身的分布。