基于seaborn的pandas-DataFrame数据可视化

seaborn是基于DataFrame级的可视化。  matplotlib就是seaborn的底层。

 1 import matplotlib.pyplot as plt
 2 import numpy as np
 3 import pandas as pd
 4 import seaborn as sns   
 5 sns.set()                         #引入seaborn的set()方法设置样式,比纯用matplotlib要多了一些东西如图底的格子纹,图例和线条的变化。
 6 rng = np.random.RandomState(0)
 7 x = np.linspace(0, 10, 500)
 8 y = np.cumsum(rng.randn(500, 6), 0)
 9 plt.plot(x, y)
10 plt.legend('ABCDEF', ncol=2, loc='upper left')

 

进行统计数据可视化时, 我们通常想要的就是频次直方图和多变量的联合分布图。
还可以用 KDE 获取变量分布的平滑估计,Seaborn 通过 sns.kdeplot 实现。
用 sns.jointplot 可以同时看到两个变量的联合分布与单变量的独立分布。

对多维数据集进行可视化时, 最终都要使用矩阵图(pairplot) 。 如果想画出所有变量中任意两个变量之间的图形, 用矩阵
图探索多维数据不同维度间的相关性非常有效。直接用 sns.pairplot 即可。也可以用 sns.jointplot 画出不同数据集的联合分布和各数据本身的分布。
 

 

posted @ 2018-10-20 16:20  Parallax  阅读(412)  评论(0编辑  收藏  举报