统计数据的类型的划分
2015-08-29 22:13 新西内几米 阅读(7083) 评论(0) 编辑 收藏 举报1.与数据相关的几个基本概念:
个体:收集数据时所依据的对象。【数据库中的关键字】
变量:对个体所感兴趣的特征。【属性】
观察值:对某个体收集到的测量值的全体。【测量值表全体】
观察值是对数据集中每个个体的各个方面进行测量所得的集合。因此它的个数总是等于个体的数量,每个个体的测量值个数等于变量的个数。数据总数=个体数*变量数。
2.对数据的测量尺度:
名义尺度:用于确认个体属性的标签或者名称。
顺序尺度:数据以名义数据显示,但数据顺序或等级之间的差异有意义。【如对于服务质量测量:优秀、良好、较差;对酒店的1-5星级的划分;班级中上成绩排名】
区间尺度:数据具有顺序数据所有的特征,并以相同的刻度或单位表示数值间的间隔。它总是数值型数据。【如学生的语文成绩分数】
比率尺度:数据数据具有区间数据所有特性,且两个数据的比值是有意义的,其测量尺度为比率尺度。
3.统计数据类型
在统计学中,统计数据主要可分为四种类型,分别是定类数据,定序数据,定距数据,定比变量。
1.定类数据(Nominal):名义级数据,数据的最低级,表示个体在属性上的特征或类别上的不同变量,仅仅是一种标志,没有序次关系。【例如, ”性别“,”男“编码为1,”女“编码为2。 】2.定序数据(Ordinal):数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。【例如,“受教育程度”,文盲半文盲=1,小学=2,初中=3,高中=4,大学=5,硕士研究生=6,博士及其以上=7。 】3.定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。统计中经常需要这种数据来时行分析。【例如,温度。】4.定比变量(Ratio):数据的最高级,既有测量单位,也有绝对零点。【例如职工人数,身高。】
一般来说,数据的等级越高,应用范围越广泛,等级越低,应用范围越受限。不同测度级别的数据,应用范围不同。等级高的数据,可以兼有等级低的数据的功能,而等级低的数据,不能兼有等级高的数据的功能。
中国统计网中有一博文提到了如下分类:
1.按计量尺度分类分类数据:只能归于某一类别的非数字型数据。【根据特征划成类。可以使用名义尺度或者顺序尺度】——分类变量顺序数据:只能归于某一有序类别的非数字型数据。【百度百科:用来表示顺序、等级的数据。如一等品、二等品;优、良、差;小学、初中、高中、大学;等等。对这类数据,要反映平均水平,只能用中位数。(显然众数也可以)】数值型数据:按数字尺度测量的观察值。——数据变量数值型数据可能是离散的也可能是连续的。如泊松分布描述的数据是离散的,正态分布等描述的数据是连续的。2.按收集方法分类观测数据:通过调查和观测而收集到的数据。实验数据:在实验中控制实验对象而收集到的数据。3.按时间状况分类截面数据:在相同或近似相同时间点上收集的数据。时间序列数据:在不同时间上收集到一段时间内的数据。