成为散点图可视化专家

成为散点图可视化专家

创建散点图的 Matplotlib 指南

Become a Pro in Scatter Plot Visualization (Credits: Aatomz)

散点图的主要目的是确定两个变量(双变量)之间的关系。散点图在回归算法中起着非常重要的作用,可以找到关系。此外,在分类问题中,散点图有助于识别特征之间的相关性。

在这里,我将解释如何创建这样一个基本的散点图,还将探索如何使用 matplotlib 使用标签、标记和颜色对其进行自定义

您可以从此下载钻石数据集 关联 用于重现此代码。

使用 Diamond 数据集创建散点图

导入必要的库

将数据文件加载到 Pandas 数据框中

 df=pd.read_csv('diamonds.csv')

创建散点图。

让我们使用 Diamond Dataset 中的散点图(620 行样本)查看克拉和价格是否相关。

借助散点图,我们可以找到二元分析。即,在这里,克拉和钻石价格之间的关系可以通过散点图可视化。

Scatter Plot

哇!我们创建了一个散点图来找出克拉和钻石价格之间的关系。然而!感觉少了点什么。

是的!如果没有轴标签,理解这种关系可能会很困难。那么让我们看看如何添加这些轴标签。

设置标签

这里我们分别使用 set_xlabel 和 set_ylabel 方法设置 X 和 Y 标签标题。 fontdict 参数有助于自定义标签格式。

CODE: Setting Label in Scatter Plot

Scatter Plot Between Carat and Price of Diamonds

现在看起来很酷;然而,我们的客户首先要问的是这个情节的用途。因此,如果您不想回答它,只需将标题放在情节上即可。确实这是一个强制性的步骤

设置标题

使用 set_title 方法,我们可以设置绘图的标题。在这里,我们也可以使用 fontdict 参数自定义标题的字体。

Code: Setting Title

所以到目前为止,我们已经检查了散点图的主要表示。让我解释一些散点图的高级选项。

设置标记:大小、颜色、形状和边缘颜色

我们还可以自定义散点图中的标记。在这里,我将解释如何调整散点图中标记的大小和形状和颜色。

使用 s 参数来改变标记的大小。

使用 C 参数来改变标记的颜色。

使用 标记 参数更改标记的类型。有关更多标记样式,请查看此 关联 .

利用 边缘颜色 参数更改标记边缘的颜色。

Code: Marker Type, Size , and Colour

添加注释

要在散点图中添加注释,我们必须执行以下步骤。

⚽️ 将所有注释按照要显示的点的顺序存储在一个列表中。
⚽️绘制散点图。
⚽️ 使用 for 循环,注释每个点。

考虑以下示例:为此,我从钻石数据框中过滤了优质钻石

step1:在高级钻石数据集中,我为注释选择了清晰度特征并将其存储为列表。
step2:绘制散点图:在这个xaxis=carat, yaxis=price。
step3:创建for循环来注释清晰度特征。

输入:

输出:

所以,我希望下次你绘制散点图时,你会搜索我的文章。如果你喜欢这个,别忘了鼓掌。

如果您想了解更多选项,请在评论中告诉我,我将在本文中更新如何执行这些功能。

在 LinkedIn 上关注我,了解有关数据可视化的更多见解

https://www.linkedin.com/in/amsavalli-datascientist/

感谢和问候

阿姆萨瓦利

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/39862/59082917

posted @ 2022-09-29 17:59  哈哈哈来了啊啊啊  阅读(113)  评论(0编辑  收藏  举报