python--数据可视化

一、数据可视化概念

  数据可视化指的是通过可视化表示来探索数据,它与数据挖掘紧密相关,而数据挖掘指的是使用代码来探索数据集的规律和关联。数据可视化旨在直观的展示信息的分析结果和构思,令某些抽象数据具象化。

  在基因研究、天气研究、政治经济分析等众多领域,大家都使用Python来完成数据密集型工作。数据科学家使用python编写了一系列令人印象深刻的可视化和分析工具。最流行的工具之一是matplotlib,它是一个数学会图库。pygal包,专注于生成适合在数字设备上显示的图表。通过使用Pygal,可在用户与图表交互时突出元素以及调整其大小,还可轻松的调整整个图表的尺寸,使其适合在微型只能手表或巨型显示器上显示。

二、matplotlib的使用

1、绘制简单的折线图

  import matplotlib.pyplot as plt

  squares = [1,4,9,16,25]

  plt.plot(squares)

  plt.show()

  我们创建了一个列表,在其中存储了前述平方数,再将这个列表传递给函数plot(),

2、使用scatter()绘制散点图并设置其样式

(1)用scatter()绘制一个点

  import matplotlib.pyplot as plt

  plt.scatter(2,4)

  plt.show()

  该代码运行后我们会在图表中央看到一个点。

(2)使用scatter()绘制一系列点

  import matplotlib.pyplot as plt 

  x_values = [1,2,3,4,5]

  y_values = [1,4,9,16,25]

  plt.scatter(x_values,y_values,1 =100]

  列表x_values包含要计算其平方值的数字,而列表y_values包含前述每个数字的平方值。将这些列表传递给scatter()时,matplotlib依次从每个列表读取一个值来绘制一个点。要绘制的坐标分别为(1,1),(2,4),(3,9),(4,16),(5,25)

(3)删除数据点轮廓以及自定义颜色

plt.scatter(x_values,y_values,c='red',edgecolor = 'none')

matplotlib允许给散点图中的各个点指定颜色。默认是蓝色和黑色轮廓,在散点图包含数据点不多时效果很好。但绘制点很多时,黑色轮廓可能会黏在一起。要删除数据点轮廓,可在调用scatter()传递实参edgecolor = 'none'。

要修改数据点的颜色,可向scatter()传递参数c,并将其设置为要使用颜色的名称。

(4)使用颜色映射

映射颜色是一系列颜色,他们从起始颜色渐变到结束颜色。

plt.scatter(x_values,y_values,c=y_values,cmap=plt.cm.Blues,edgecolor = 'none',s=40)

将参数c设置成了一个y值列表,并使用参数cmap告诉Pyplot该如何设置数据集中的每个点的颜色。这些代码将y值较小的点显示为浅蓝色,并将y值较大的点显示为深蓝色。

(5)自动保存图表

plt.savefig('squares_plot.png',bbox_inches = 'tight')

第一个实参指定要以什么样的文件名保存图表,这个文件将存储到scatter_squares.py所在的目录中;第二个实参指定将图表多余的空白区域裁剪掉。如果要保存图表周围多余的空白区域,可省略这个实参。

三、使用pygal

使用python 生成可缩放的矢量图形文件。对于需要在尺寸不同的屏幕上显示的图表,pygal可以使他们自由缩放,以适合观看者的屏幕。如果是以在线的方式使用图表,可以考虑用pygal来生成它们。这样在任何设备上显示都会很美观。

 

  

  

posted @   吴然_O_o_o  阅读(140)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示