数据可视化
1、练习:学生来自哪里
花4秒钟观察下表
这个样本中的大多数学生来自哪个国家?
美国
加拿大
(√)中国
日本
瑞典
墨西哥
德国
2、练习:频率
请填入每个国家的频率:
国家 | 频率 |
---|---|
加拿大 | 2 |
中国 | 12 |
英国 | 2 |
德国 | 3 |
印度 | 8 |
日本 | 8 |
墨西哥 | 3 |
巴基斯坦 | 1 |
瑞典 | 1 |
美国 | 10 |
3、练习:每个、中国、巴基斯坦
问题
有多少学员来自美国?10
有多少学员来自美国、中国或者巴基斯坦中的任意一个国家?23
哪两个国家的学员人数最少?巴基斯坦、瑞典
4、练习:相对频率
请输入中国、德国和日本的相对频率。
国家 | 频率 | 相对频率 |
---|---|---|
加拿大 | 2 | 2/50 = 0.04 |
中国 | 12 | 0.24 |
英国 | 2 | |
德国 | 3 | 0.06 |
印度 | 8 | |
日本 | 8 | 0.16 |
墨西哥 | 3 | |
巴基斯坦 | 1 | |
瑞典 | 1 | |
美国 | 10 |
5、练习:比例的范围
问题:(样本中)所有比例均大于等于多少,小于等于多少?
0~1
6、练习:相对频率之和
问题:对于任何频率表,所有相对频率之和应当等于多少?
1
7、练习:国家的比例
问题
来自美国的学员的比例是多少?0.20
来自印度的学员的比例是多少?0.16
下面哪一个大洲的学员比例更高?
欧洲
(√)亚洲
8、练习:转换为百分比
练习:请输入中国、德国和日本的百分比。
国家 | 频率 | 相对频率 | 百分比 |
---|---|---|---|
加拿大 | 2 | 0.04 | 4% |
中国 | 12 | 0.24 | 24% |
英国 | 2 | 0.04 | |
德国 | 3 | 0.06 | 6% |
印度 | 8 | 0.16 | |
日本 | 8 | 0.16 | 16% |
墨西哥 | 3 | 0.06 | |
巴基斯坦 | 1 | 0.02 | |
瑞典 | 1 | 0.02 | |
美国 | 10 | 0.20 |
大洲 | 频率 | 相对频率 |
---|---|---|
北美洲 | 15 | 30% |
亚洲 | 29 | 58% |
欧洲 | 6 | 12% |
11、练习:行数
你的表格需要多少行?
□ 50 行(每个学员一行)
□ 66 行(每个年龄一行,10-75)
□ 8-10 行(这样表格比较简单易懂)
(√)□ 取决于你如何去整理数据
□ 2 行(大于50岁一行,小于50岁一行)
请填入20-39岁对应的频率:50-(19+5+5)=21
13、数据可视化
给出一组混乱无章的数据,我们可以通过频率表轻松地对数据可视化。
14、练习:直方图
请标出四个分组扥别对应的高度
15、不同组距
选择适当的组距
16、练习:更小的组距
17、练习:找到组距
18、练习:频率最大的年龄
19、练习:60岁以上的比例
20、练习:60岁以下的百分比
21、练习:小于20岁
22、练习:大洲图表
23、练习:图表之间的差异
左边的叫做直方图,右边的叫做柱状图。柱之间的这些空间表示,每个柱都是独特的类别,欧洲与北美完全不一样,与亚洲不一样,我们不会弄混它们。但是对于年龄来说,我们可以选择任何区间或组距。你可以更改年龄数据的组距,但是国家数据则不行。最后,各大洲的顺序并不重要,但是年龄只有一个顺序,从更小的年龄到更大的年龄。对于直方图来说,x轴上的变量是值,可以量化的,而对于柱状图来说,x轴上的变量通常分类或定性的。
24、练习:有偏差的图表
25、改变组距
选择适合的组距
26、练习:解读直方图
选择:不论组距是多少,下面哪个选项总是正确的?
27、偏斜分布
选择:从这个分布图中,我们可以得出什么结论?