PS:标红的为不懂的,后面进行补充。
第二章:描述性统计分析
2.1直方图
2.1.1定义
2.1.2如何利用
2.1.3如何画(这里要阐明的是,课件用的是SASS和R语言,但是这里要补充的还是以Python为主
,数据来源应当以股票市场数据进行分析和画)
2.1.4使用Excel2013绘制(略)
2.2数据的计量尺度
数据的计量尺度:
对计量对象量化时采用的具体标准,它分为四类:定类尺度,定序尺度,定距尺度和定比尺度。
定类尺度计量的数据表现为“类别”,各类之间无等级次序,数据间都不存在内部固有的大小或高低顺序,只能用来比较相等或者不相等,而不能比较大小,更不能用来进行四则算术运算,比如:性别,民族,职业等。
定距尺度不仅能将事物区分为不同类型并进行排序,而且可以准确地支出类别之间的差距是多少。定距尺度的计量数据表现为数值,由于这种尺度的每一间隔都是相等的,只要给出一个度量单位,就可以准确地支出两个计数之间的差值,可以进行排序也可以比较大小,还可以进行加减运算。另外,在定距尺度上,‘0’只是尺度上的一个点,不代表‘不存在’。典型的定距尺度变量包括年份,摄氏温度,纬度等。
定比尺度也成比率尺度,它是在定距尺度的基础上海存在可以作为比较的共同起点或者基础。它除了具有定类,定序,定距三种计量尺度的全部特征以外,还可以进行乘除运算,‘0’表示‘没有’或‘不存在’。另外,定距尺度数据还具有一个特性,那就是可以计算两个测度值之间的比值。大多数物理量,比如:质量,长度和能量都是定比尺度数据。
定类尺度和定序尺度数据都是定性的,而定距尺度和定比尺度数据都是定量的。对于定量数据,根据数据是否可数,分为离散型数据和连续型数据。
数据的计量尺度一览表表(略)
以上四个计量尺度都是没有说明逻辑和数学运算关系。
2.3数据的集中趋势
集中趋势在统计学中士指一组向某一中心支靠拢的程度,它反映了一组数据中心店的位置所在。集中趋势测度就是寻找数据水平的代表值或者中心值。
比较常见:
平均值
中位数
众数
2.3.1定量数据:平均数
定义:是描述定量数据的集中趋势,是最常用的一种测度值。它主要适用于定量数据,而不适用与定型数据。
类型:数据不同分为:简单算术平方数,加权算法平均数和几何算法平均数等。
2.4极差
2.5数据分布的测度
2.6数据的展示-统计图
2.7使用Excel实现数据的描述性统计及分析
2.8课后习题