随笔分类 - 数据分析
摘要:1.标准正态分布 根据分布值得到累计密度函数,例如分布值为1,则累计密度为: 0.5 + 0.841344746068543 ≈ 0.841 也就是当标准差位于+1时候的累计密度。 正太分布中+1个标准差的面积概率是:34.1% 正太分布中+2个标准差的面积概率是:13.6% 正太分布中+3个标准差
阅读全文
摘要:平均差是数据组中各数据值与其算术平均数离差绝对值的算术平均数,常用符号"M.D"表示。 当变量数列是由没有分组的数据组成或分组后每组的次数相等的数据组成时采用。 案例: 设某个工厂有2个车间,各有5个工人,其日产量如下表: A车间的平均值为: B车间的平均值为: 那么两车间工人的日产量的平均差计算过
阅读全文
摘要:分位距是对全距的一种改进,它是从一组数据中剔除了一部分极端值之后重新计算的类似于全距的指标。常用的有四分位距、八分位距、十分位距等。 四分位距计算公式为: 四分位距排除了数列两端各25%单位标志值的影响,反映了数据组中间部分各变量值的最大数与最小数距离中位数的平均离差。 实际例子 已知一组数据,有8
阅读全文
摘要:描述性统计分析,主要包括数据的集中趋势、离中趋势和数据分布的测度指标的分析方法,直方图、茎叶图、箱线图等统计图的含义和画法 1.直方图 直方图有以下两种: 频率分布直方图:用长方形的面积代表对应组的频数和组距的比 频数分布直方图:长方形的高代表对应组的频数 为了画图和看图方便,通常直接用高表示频数,
阅读全文
摘要:以下操作是基于Office 2016 版本 单击【文件】-->> 【选项】-->>【加载项】-->>【转到】 在加载项目中,添加【分析工具库】 如果在上图列表中没有【分析工具库】,可以单击【浏览】,如果系统提示是否安装,单击"是"即可。 安装完成后,在【数据】中可以看到【数据分析】
阅读全文