(2)中位数
中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数用Me表示。
从中位数的定义可知,所研究的数据中有一半小于中位数,一半大于中位数。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。
在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响;如果研究目的就是为了反映中间水平,当然也应该用中位数。在统计数据的处理和分析时,可结合使用中位数。
中位数的计算:确定中位数,必须将总体各单位的标志值按大小顺序排列,最好是编制出变量数列。这里有两种情况:
1、对于未分组的原始资料,首先必须将标志值按大小排序。设排序的结果为:
则中位数就可以按下面的方式确定:
例如,根据下表的数据,计算50名工人日加工零件数的中位数。
中位数的位置在(50+1)/2 = 25.5,中位数在第25个数值(123)和第26个数值(123)之间,即Me = (123+123)/2=123(件)。
2、由分组资料确定中位数
由组距数列确定中位数,应先按的公式求出中位数所在组的位置,然后再按下限公式或上限公式确定中位数。
公式中:
Me——中位数;
L——中位数所在组下限;
U——中位数所在组上限;
fm——为中位数所在组的次数;
——总次数;
d——中位数所在组的组距;
Sm − 1——中位数所在组以下的累计次数;
Sm + 1——中位数所在组以上的累计次数。
例:根据上面例表的数据,计算50名工人日加工零件数的中位数。
解(某企业50名工人加工零件中位数计算表):
由上表可知,中位数的位置=50/2=25,即中位数在120~125这一组,L=120,Sm − 1 = 16,U=125,Sm + 1 = 20,fm = 14,d=5,根据中位数公式得:
(3)众数
众数是指一组数据中出现次数最多的那个数据,一组数据可以有多个众数,也可以没有众数。众数是由英国统计学家皮尔生首先提出来的。所谓众数是指社会经济现象中最普遍出现的标志值。从分布角度看,众数是具有明显集中趋势的数值。
统计上把这种在一组数据中出现次数最多的变量值叫做众数。用Mo表示。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。
众数的计算:一般情况下,找出一组数据中出现次数最多的数值即可。但若所掌握的资料是组距式数列,则只能按一定的方法来推算众数的近似值。计算公式为:
公式中:
L——众数所在组下限;
U——众数所在组上限;
——众数所在组次数与其下限的邻组次数之差;
——众数所在组次数与其上限的邻组次数之差;
d——众数所在组组距。
例:根据下表的数据,计算50名工人日加工零件数的众数。
解:从表中的数据可以看出,最大的频数值是14,即众数组为120~125这一组,根据公式得50名工人日加工零件的众数为:
众数是一种位置平均数,是总体中出现次数最多的变量值,因而在实际工作中有时有它特殊的用途。诸如,要说明一个企业中工人最普遍的技术等级,说明消费者需要的内衣、鞋袜、帽子等最普遍的号码,说明农贸市场上某种农副产品最普遍的成交价格等,都需要利用众数。但是必须注意,从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在;如果有两个最高峰点,也可以有两个众数。只有在总体单位比较多,而且又明显地集中于某个变量值时,计算众数才有意义。
如果一组数据中存在离群值,中位数和众数一般不受离群值的影响,算术平均数容易受到离群值的影响。