1.1 :统计学:数据的科学
定义1.1 统计学:是数据的科学,包括数据的收集、分类、概括、整理、分析以及解释。
统计学经常用于两种类型问题的解决:
1、概括,描述以及探索数据。(对应为描述性统计学)
2、利用样本数据推断被选取样本的数据集的性质。(对应为推断统计学)
定义1.2 描述性统计学:致力于数据集的整理、概括、以及描述的统计学分支
定义1.3 推断统计学:利用样本数据对一个很大的数据集作出推断的统计学分支
1.2 :统计学的基本要素
统计学的基本要素:1、总体,2、样本,3、试验单位 ,4、变量,5、推断
定义1.4 总体:我们刚兴趣目标的数据集(通常很大,有时是概念上的)
定义1.5 样本:取自目标总体的数据的子集
定义1.6 试验单位:测量值采集的对象(例如人、事物,交易,标本或者事件等)
定义1.7 变量:单个试验单位的特征或性质
定义1.8 可靠性度量:关于统计推断不确定程度的一个陈述(通常是定量的)
注:一个总体是由对许多试验单位采集数据的组成。
描述性统计学4要素:
1、感兴趣的总体或目标
2、被研究的一个或多个变量(总体或样本单位的特征)
3、 表格、图形或者数字概括工具
4、确定数据类型
推断性统计问题的5要素:
1、感兴趣的总体
2、被研究的一个或多个变量(试验单位的特征)
3、试验单位的样本
4、基于包含在样本中的信息对总体的推断
5、推断的可靠性度量
1.3 :数据类型
数据类型分为定量和定性数据
定义1.9 定量数据:表示事物的数量或者个数
定义1.10 定性数据:没有量的解释,只能以类型分类
用于描述、分析数据的合适的统计工具是依赖于数据类型的。因此区分定量还是定性数据是十分重要的。