在 Seaborn 中可视化条形图
在 Seaborn 中可视化条形图
让我们讨论在 Seaborn 中创建条形图的不同可视化技术。
条形图是另一种在数据分析中经常使用的绘图类型。 Seaborn 有一个名为 bar plot 的快速函数,可以在一行代码中创建绘图。
让我们看一些创建条形图的示例。我们将继续使用该任务的内置数据集。
要访问数据集,我们需要将 seaborn 导入我们的环境。如前所述,我们可以通过执行以下命令来实现:
将 seaborn 导入为 sns
接下来,让我们在我们的环境中加载数据集。我们将继续使用 mpg 数据集作为示例。
让我们将数据加载为 df。
Image by Author
要检查列的名称,我们将使用同名的数据框属性,即列。
Image by Author
现在让我们在汽车原点和气缸数之间创建第一个条形图。
我们将运行以下命令:
Image by Author
在这里,我们将原产国放在 x 轴上,将气缸数放在 y 轴上。
让我们尝试通过一些计算来理解输出图。
默认情况下,条形的高度是数据点的加权平均值。
例如,我们看到对于美国原产地,y 轴值略大于六。
我们将首先过滤掉美国的数据,然后计算每种气缸类型的值计数。
我们可以通过运行以下代码来实现:
Image by Author
我们看到 8 缸汽车有 103 个条目,有 74 个和 72 个条目
分别是6缸和4缸汽车。
我们可以计算加权平均值来获得一个单一的数字进入美国。
Image by Author
我们得到 6.25 的值,等于在运行生成条形图的代码时的初始观察值。
同样,我们可以计算其余两个国家的加权平均值。
Image by Author
对于以下示例,我们将加载企鹅数据集。
df = sns.load_dataset('企鹅')
我们现在可以使用这个数据集来探索条形图的其他参数。
我们将从用于根据特定列为数据点着色的色调参数开始。我们将使用岛列作为物种与帐单深度图表的色调。
我们可以通过以下方式实现:
Image by Author
从输出中,我们可以看到阿德利企鹅是最常见的物种。
接下来,查看用于将集中趋势从均值更改为任何其他估计量(例如中位数)的估计量参数。
我们需要导入 NumPy 来访问中值计算。
Image by Author
接下来,我们有置信区间参数,其中默认值为 95%,可以根据需要更改为任何数字。
假设我们想要以 90% 的置信区间绘制物种与体重的关系图。
我们可以通过运行以下命令来实现:
Image by Author
如果我们想要一个特定的顺序来绘制分类数据,我们需要在 order 参数中提到它。
假设我们希望以相反的顺序绘制物种,即“Gentoo”、“Chinstrap”和“Adelie”。
我们可以通过以下方式实现:
第 1 步我们创建一个变量,在其中声明我们想要的顺序。
步骤 2 在条形图函数的 order 参数中传递上述变量。
Image by Author
Image by Author
正如我们所见,条形图的顺序已根据变量“my_order”而改变。
接下来,我们可以根据我们想要的方向自定义条形图,即水平条或垂直条。
默认情况下,seaborn 会通过推断数据来绘制绘图,但我们也可以根据需要提供方向。
例如,要绘制与上一个示例相同的图形,我还可以给出如下所示的命令:
Image by Author
在这里,我们明确提到了垂直或“v”的方向。
接下来,我们可以通过编辑饱和度参数来改变亮度或饱和度。
例如,如果你输入一个小于百分之六十的数字,你会看到一个更暗的颜色,如下图所示:
Image by Author
最后,我们有调色板参数,用于将颜色组合从默认更改为我们想要在绘图中使用的任何颜色。
我们已经在之前的文章中讨论过这个参数,所以让我们看一个例子:
Image by Author
如果您错过了折线图上的文章,可以在以下链接中阅读:
[
在 Python 的 Seaborn 库中可视化折线图
让我们讨论在 Seaborn 中创建折线图的不同可视化技术。
媒体网
](/@mishrapartha/visualizing-line-charts-in-seaborn-library-of-python-7f2e98cbcce6)
直到下一次!
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明