课程二:统计学基本原理

1.可测量数据和不可测量数据

  从数据的本质上来说,统计学里将其分为可测量数据和不可测量数据,用更通俗的描述也就是数值类数据和分类数据。举个例子,人的身高是可以测量的,也就是有一个具体值的,比如178cm,179cm,是有一个固定的标准可以用工具计算出来的,此类即为可测量数据(数值类),还有一类数据,比如居住的地区,这类数据是主观上用来分类的,并没有一个固定的公式或工具计算,此类即为不可测量数据(分类数据)。

2.分组、组中值、次数和相对次数

  统计学中,会将原始数据按照一定的规则分成几个观测组,比如将人群按照年龄划分,0-10岁一组,10-20岁一组,20-30岁一组,每组作为一个单独的数据实体进行分析。组中值是指位于分组类中间段的数值,一般计算公式为组中最大值与最小值和的一半。次数是指某个分组内观测实体的个数,比如上面10-20岁的组里有10人,那么这个组的次数即为10。相对次数有点类似百分比,指某个分组中观测实体占整个观测实体的百分比,比如上面总人数有100人,10-20岁的组里有10人,那么这个组的相对次数则为0.1或10%。

3.直方图

  直方图用来描述一个观测样本中实体的分布情况,通过分组、组中值、次数或相对次数来图形化展现整体的分布。其中横轴表示组并用组中值标记每个组,纵轴表示次数或相对次数,例如:

4.算数平均/几何平均/调和平均/中位数/标准差/标准化/离差

  算数平均:(X1+X2+....+Xn)/n

  几何平均:

  调和平均:

  中位数:  如果样本为奇数,那么中位数为按序排列的样本中位于最中间的一个。如果样本为偶数,则为中间两个样本值的一半。

  标准差:  分为总体标准差 

                样本标准差            

  标准化: 指标准计分,用于对于不同比较标准的数据进行对比,公式如下:

               

  离差: 

 

  离差与标准计分的对比如下:

 

 

 

  同一类标准差或离差之间进行比较时,一定要注意所选取的对象范围要相同,不然比较是无意义的。

 

5.求机率

posted @ 2014-03-04 14:12  Chris-Hu  阅读(1306)  评论(0编辑  收藏  举报