如何一分钟内画好可视化图形
一、定类数据
- 饼图
描述:用形状类似“饼”的形态描述数据的占比,并且参与绘制的数值没有负值,比如想要直观的查看“月生活费各个板块的占比”。
操作:以SPSSAU为例,使用“频数分析”即可。
示例:
- 圆环图
描述:圆环图显示各个部分与整体之间的关系,可以包含多个数据,比如想要直观的查看“月生活费各个板块的占比”。
操作:与饼图操作一致。
示例:
- 条形图
描述:是用宽度相同的条形的高度或长短来表示数据多少。比如想要直观的查看“月生活费各个板块的分布”。
操作:与饼图操作一致。
示例:
- 词云图
描述:是由美国西北大学新闻学教授Rich Gordon提出,“词云”可对文字中出现频率较高的“关键词”予以视觉上的突出,使浏览者只要一眼扫过文本就可以领略文本的主旨。比如“想要查看房价的热度”。
操作:
也可以整理txt文件,点击“上传txt文件”。
示例:
- 直方图
描述:直方图用于直观展示数据特征情况,观察数据的正态分布特性,检验数据是否满足分析方法的前提(正态性)。比如“在独立样本t检验之前进行查看数据是否满足正态分布”。
操作:
示例:
- 帕累托图
描述:帕累托图是“二八原则”的图形化体现,80%的问题是由20%的原因所致;通常情况下帕累托图可用来展现某‘问题’的占比情况。比如研究“员工离职原因”。
操作:
示例:
二、定量数据
- 折线图
描述:折线图可以显示连续变量随时间等变化的情况,比如最常见的“温度的变化”。
操作:
示例:
- 柱形图
描述:是用宽度相同的条形的高度或长短来表示数据多少。比如“对照组和实验组中的铁的浓度”。
操作:与折线图一致。
示例:
- pp/qq图
描述:P-P图和Q-Q图常用于直观查看数据是否正态分布。比如“在独立样本t检验之前进行查看数据是否满足正态分布”。
操作:
可以选择使用P-P图进行分析还是Q-Q图进行分析。
示例:
P-P图:
Q-Q图:
三、多变量数据
1、X为定类/Y为定量
折线图、柱形图、条形图与上述一致。
- 雷达图
描述:雷达图是以从同一点开始的轴上表示的三个或更多个定量变量的可视化图形,比如"研究对照组和实验组中的铁的浓度”。
操作:
示例:
- 误差线图
描述:误差线图用于展示数据的不确定性程度,显示潜在的误差或每个数据标志的不确定程度。
操作:
示例:
- 象限图
描述:象限图在科学研究中,常见为IPA分析研究时使用,即分析期望与实际感知间的gap差异情况。比如“研究三亚旅游满意程度”。
操作:
示例:
2、X为定量/Y为定类
- 堆积柱形图
描述:堆积的柱形图。
示例:
- 堆积条形图
示例:
4、变量都是定类变量
堆积柱形图和堆积条形图与上述一致。
5、变量都是定量变量
- 散点图
描述:散点图用于考察定量数据之间的关联关系,即查看X和Y之间的关系情况。比如“身高和体重的关系”。
操作:
示例:
6、2个X为定类/Y为定量
误差线图与上述一致。
- 簇状图
描述:簇状图用于展示两个分类数据时的特征,比如不同性别并且不同学历群体时,平均身高的特征差异。
操作:
示例:
- 箱线图
描述:使用箱线图直观地判断数据离散分布情况,了解数据分布状态。比如“不同班级的期末语文成绩”。
操作:
示例:
- 核密度图
描述:使用核密度图直观查看数据分布情况,比如“不同性别的身高数据”。
操作:
示例:
- 小提琴图
描述:使用小提琴图直观查看数据分布情况,比如“不同性别的身高数据”。
操作:
示例:
7、其它
- Roc曲线
描述:ROC曲线当前在医学领域使用非常广泛,用于研究X对于Y的预测准确率情况。
操作:
示例:
参考资料:
- 气泡图
描述:气泡图可用于展示X和Y之间的关系情况,并且利用Z标识每个点的气泡大小。
操作:
示例: