python3项目之数据可视化
数据可视化指的是通过可视化表示来探索数据,它与数据挖掘紧密相关,而数据挖掘指的是使用代码来探索数据集的规律和关联。
数据科学家使用Python编写了一系列令人印象深刻的可视化和分析工具,其中很多也可供你使用。
最流行的工具之一是matplotlib,它是一个数学绘图库,我们将使用它来制作简单的图表,如折线图和散点图。然后,我们将基于随机漫步概念生成一个更有趣的数据集——根据一系列随机决策生成的图表。
我们还将使用Pygal包,它专注于生成适合在数字设备上显示的图表。通过使用Pygal,可在用户与图表交互时突出元素以及调整其大小,还可轻松地调整整个图表的尺寸,使其适合在微型智能手表或巨型显示器上显示。我们将使用Pygal以各种方式探索掷骰子的结果。
(一)安装 matplotlib
1.1 在 Linux 系统中安装 matplotlib
如果你使用的是系统自带的Python版本,可使用系统的包管理器来安装matplotlib,为此只需执行一行命令:
$ sudo apt-get install python3-matplotlib
如果你使用的是Python 2.7,请执行如下命令:
$ sudo apt-get install python-matplotlib
如果你安装了较新的Python版本,就必须安装matplotlib依赖的一些库:
$ sudo apt-get install python3.5-dev python3.5-tk tk-dev
$ sudo apt-get install libfreetype6-dev g++
再使用pip来安装matplotlib:
$ pip install --user matplotlib
1.2测试 matplotlib
$ python3
>>> import matplotlib
>>>
如果没有出现任何错误消息,就说明你的系统安装了matplotlib。
1.3 matplotlib 画廊
要查看使用matplotlib可制作的各种图表,请访问http://matplotlib.org/的示例画廊。单击画廊中的图表,就可查看用于生成图表的代码。
(二)绘制简单的折线图
下面来使用matplotlib绘制一个简单的折线图,再对其进行定制,以实现信息更丰富的数据可视化。
我们将使用平方数序列1、4、9、16和25来绘制这个图表。