《为你的信息选择正确的图形》笔记

原文链接,作者:Stephen Few

 

 

定量和分类数据

简单来说,分类数据告诉我们是什么,而定量数据告诉我们有多少,定量数据如果缺少相关的分类数据,将会毫无用处。
一个图表中可能包含不止一种分类数据,比如下图中包含两套分类数据,时间和地区(地区作为时间分类的子分类):
分类数据举例

无论这个类型和它的子分类是什么,都是三种类型之一:
1. Nominal 名词性的
2. Ordinal 表示次序的
3. Interval 表示间隔的
Interval通常是由量化范围转变而来的,比如把本来为连续性的年龄划分为几个年龄段。处理表示间隔的数据需要特别小心,如果不能恰当处理,将会产生误导性的信息。
Interval数据举例
上图中展示了3中表示20-79岁的方法,左图中的时间间隔是相同的,而另两幅图中的时间间隔不同,不同时间间隔展示出的信息完全不同。

编码定量信息

展示数量不同的方式有:二维坐标、长度、大小、形状、方向和颜色,可以用这些方式编码和区分定量和分类数据。在所有这些方式当中,只有两种能非常高效地展示定量信息:二维坐标和长度。
二维坐标和长度
三幅图横纵坐标轴的刻度均相同,三幅图展示了表示定量数据时最有效的三种图表类型:点、线、长条,每种类型的图在编码定量数据时都有各自的优点和不足,都是展示定量信息时的最佳选择。

点可以使用任何基本的几何形状,比如圆圈(或点)、斜线、正方形、三角形等等,从而在视觉上强调它们展示的数据。除非是在散点图中,其他情况下点很少单独被使用,更常见的是和连接线一起使用。
当横纵坐标均表示定量的尺度时,不应使用线或者长条来编码数据,只有可以忽略高度和宽度的的点才能被用来展示两个定量尺度的交叉区域,比如纵轴表示18岁时的教育水平,横轴表示薪酬为132000美元。除散点图以外,点很少被单独使用的原因是它们缺少能够清晰展示数据整体形状的视觉影响力。

线

线在图表中被用于编码定量数据的两种情形:

  • 连接一系列单个的点
  • 展示一系列点的趋势

线能很好地展示数据流的形状和变化,线在展示值随着时间推移而上下浮动变化时特别有用,能很清晰地反映出从一个点到另一个点之间的变化。

长条

长条相对于点和线来说时很有视觉影响力的,通过二维坐标对应的两个属性以及线的长度来编码量化的值,强调出每一个分类的值,比如表示一系列单独的部门或地区的费用。

数据的7种基本类型

这7种类型的定量信息的区别在于分割数值的方式不同,定量信息总会显示出一些系,这些关系将展示出值得注意的重要内容。7种类型包括:
* Nominal comparison —— 名词性对比
* Time-series —— 时间序列
* Ranking —— 排序
* Part-to-whole —— 部分和整体
* Deviation —— 偏差
* Frequency distribution —— 频率分布
* Correlation —— 相关性

这里写图片描述
这里写图片描述

图形选择矩阵
图形选择矩阵

 

posted @ 2018-02-01 22:51  huidan  阅读(318)  评论(0编辑  收藏  举报