数据分析方法

常用的数据分析方法包括以下13种:

1. 描述统计

描述性统计是指运用制表和分类,图形以及计算概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。

2. 假设检验

参数检验

参数检验主要包括U验和T检验

1)U验 使用条件:当样本含量n较大时,样本值符合正态分布

2)T检验 使用条件:当样本含量n较小时,样本值符合正态分布

非参数检验

非参数检验是针对总体分布情况做的假设,

主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-3. 信度分析:检査测量的可信度,例如调查问卷的真实性。

4. 列联表分析:用于分析离散变量或定型变量之间是否存在相关。

5. 相关分析:研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。

6. 方差分析

使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。

7. 回归分析

包括:一元线性回归分析、多元线性回归分析、Logistic回归分析以及其他回归方法:非线性回归、有序回归、加权回归等

8. 聚类分析:样本个体或指标变量按其具有的特性进行分类,寻找合理的度量事物相似性的统计量。

9. 判别分析:根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体

10. 主成分分析:将彼此相关的一组指标转化为彼此独立的一组新的指标变量,并用其中较少的几个新指标变量就能综合反应原多个指标变量中所包含的主要信息 。

11. 因子分析:一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法

12. R0C分析

R0C曲线是根据一系列不同的二分类方式(分界值或决定阈).以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线

13. 其他分析方法

时间序列分析、生存分析、对应分祈、决策树分析、神经网络。

学习分析方法内容,使用方法,搞清楚这些算法的使用条件背景,你就可以轻松入门一名数据分析师了,在学习数据分析方法的过程中,有什么不懂得地方可以咨询CDA数据分析老师。也可以让CDA数据分析老师给您做一份详细的数据分析学习方案。

posted @ 2020-02-25 10:28  一只竹节虫  阅读(214)  评论(0编辑  收藏  举报