成为散点图可视化专家
成为散点图可视化专家
创建散点图的 Matplotlib 指南
Become a Pro in Scatter Plot Visualization (Credits: Aatomz)
散点图的主要目的是确定两个变量(双变量)之间的关系。散点图在回归算法中起着非常重要的作用,可以找到关系。此外,在分类问题中,散点图有助于识别特征之间的相关性。
在这里,我将解释如何创建这样一个基本的散点图,还将探索如何使用 matplotlib 使用标签、标记和颜色对其进行自定义
您可以从此下载钻石数据集 关联 用于重现此代码。
使用 Diamond 数据集创建散点图
导入必要的库
将数据文件加载到 Pandas 数据框中
df=pd.read_csv('diamonds.csv')
创建散点图。
让我们使用 Diamond Dataset 中的散点图(620 行样本)查看克拉和价格是否相关。
借助散点图,我们可以找到二元分析。即,在这里,克拉和钻石价格之间的关系可以通过散点图可视化。
Scatter Plot
哇!我们创建了一个散点图来找出克拉和钻石价格之间的关系。然而!感觉少了点什么。
是的!如果没有轴标签,理解这种关系可能会很困难。那么让我们看看如何添加这些轴标签。
设置标签
这里我们分别使用 set_xlabel 和 set_ylabel 方法设置 X 和 Y 标签标题。 fontdict 参数有助于自定义标签格式。
CODE: Setting Label in Scatter Plot
Scatter Plot Between Carat and Price of Diamonds
现在看起来很酷;然而,我们的客户首先要问的是这个情节的用途。因此,如果您不想回答它,只需将标题放在情节上即可。确实这是一个强制性的步骤
设置标题
使用 set_title 方法,我们可以设置绘图的标题。在这里,我们也可以使用 fontdict 参数自定义标题的字体。
Code: Setting Title
所以到目前为止,我们已经检查了散点图的主要表示。让我解释一些散点图的高级选项。
设置标记:大小、颜色、形状和边缘颜色
我们还可以自定义散点图中的标记。在这里,我将解释如何调整散点图中标记的大小和形状和颜色。
使用 s 参数来改变标记的大小。
使用 C 参数来改变标记的颜色。
使用 标记 参数更改标记的类型。有关更多标记样式,请查看此 关联 .
利用 边缘颜色 参数更改标记边缘的颜色。
Code: Marker Type, Size , and Colour
添加注释
要在散点图中添加注释,我们必须执行以下步骤。
⚽️ 将所有注释按照要显示的点的顺序存储在一个列表中。
⚽️绘制散点图。
⚽️ 使用 for 循环,注释每个点。
考虑以下示例:为此,我从钻石数据框中过滤了优质钻石
step1:在高级钻石数据集中,我为注释选择了清晰度特征并将其存储为列表。
step2:绘制散点图:在这个xaxis=carat, yaxis=price。
step3:创建for循环来注释清晰度特征。
输入:
输出:
所以,我希望下次你绘制散点图时,你会搜索我的文章。如果你喜欢这个,别忘了鼓掌。
如果您想了解更多选项,请在评论中告诉我,我将在本文中更新如何执行这些功能。
在 LinkedIn 上关注我,了解有关数据可视化的更多见解
https://www.linkedin.com/in/amsavalli-datascientist/
感谢和问候
阿姆萨瓦利
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明