python--数据可视化
一、数据可视化概念
数据可视化指的是通过可视化表示来探索数据,它与数据挖掘紧密相关,而数据挖掘指的是使用代码来探索数据集的规律和关联。数据可视化旨在直观的展示信息的分析结果和构思,令某些抽象数据具象化。
在基因研究、天气研究、政治经济分析等众多领域,大家都使用Python来完成数据密集型工作。数据科学家使用python编写了一系列令人印象深刻的可视化和分析工具。最流行的工具之一是matplotlib,它是一个数学会图库。pygal包,专注于生成适合在数字设备上显示的图表。通过使用Pygal,可在用户与图表交互时突出元素以及调整其大小,还可轻松的调整整个图表的尺寸,使其适合在微型只能手表或巨型显示器上显示。
二、matplotlib的使用
1、绘制简单的折线图
import matplotlib.pyplot as plt
squares = [1,4,9,16,25]
plt.plot(squares)
plt.show()
我们创建了一个列表,在其中存储了前述平方数,再将这个列表传递给函数plot(),
2、使用scatter()绘制散点图并设置其样式
(1)用scatter()绘制一个点
import matplotlib.pyplot as plt
plt.scatter(2,4)
plt.show()
该代码运行后我们会在图表中央看到一个点。
(2)使用scatter()绘制一系列点
import matplotlib.pyplot as plt
x_values = [1,2,3,4,5]
y_values = [1,4,9,16,25]
plt.scatter(x_values,y_values,1 =100]
列表x_values包含要计算其平方值的数字,而列表y_values包含前述每个数字的平方值。将这些列表传递给scatter()时,matplotlib依次从每个列表读取一个值来绘制一个点。要绘制的坐标分别为(1,1),(2,4),(3,9),(4,16),(5,25)
(3)删除数据点轮廓以及自定义颜色
plt.scatter(x_values,y_values,c='red',edgecolor = 'none')
matplotlib允许给散点图中的各个点指定颜色。默认是蓝色和黑色轮廓,在散点图包含数据点不多时效果很好。但绘制点很多时,黑色轮廓可能会黏在一起。要删除数据点轮廓,可在调用scatter()传递实参edgecolor = 'none'。
要修改数据点的颜色,可向scatter()传递参数c,并将其设置为要使用颜色的名称。
(4)使用颜色映射
映射颜色是一系列颜色,他们从起始颜色渐变到结束颜色。
plt.scatter(x_values,y_values,c=y_values,cmap=plt.cm.Blues,edgecolor = 'none',s=40)
将参数c设置成了一个y值列表,并使用参数cmap告诉Pyplot该如何设置数据集中的每个点的颜色。这些代码将y值较小的点显示为浅蓝色,并将y值较大的点显示为深蓝色。
(5)自动保存图表
plt.savefig('squares_plot.png',bbox_inches = 'tight')
第一个实参指定要以什么样的文件名保存图表,这个文件将存储到scatter_squares.py所在的目录中;第二个实参指定将图表多余的空白区域裁剪掉。如果要保存图表周围多余的空白区域,可省略这个实参。
三、使用pygal
使用python 生成可缩放的矢量图形文件。对于需要在尺寸不同的屏幕上显示的图表,pygal可以使他们自由缩放,以适合观看者的屏幕。如果是以在线的方式使用图表,可以考虑用pygal来生成它们。这样在任何设备上显示都会很美观。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现