摘要:【数据分析师 Level 1 】19.时间序列 趋势分解法 时间序列预测技术就是通过对预测目标自身时间序列的处理,来研究其变化趋势的。一个时间序列往往是一下几类变化形式的叠加或耦合。 长期趋势变动:是指时间序列朝着一定的方向上持续上升或下降,或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势;
阅读全文
摘要:【数据分析师 Level 1 】18.聚类分析 层次聚类法 层次聚类法通常分为自底向上和自顶向下。两种方法的运算原理其实是相同的。只不过实际计算是方向相反 自底向上,又叫做合并法。这种方法是先将每个样本分别作为一个独立的类,然后通过距离计算,将距离相近的两个样本合并为一类,其他样本仍然各自为一类。不
阅读全文
摘要:【数据分析师 Level 1 】17.分类分析 1相关性检验 列联表和卡方检验 分类变量之间的相关性一般可以采用列联表分析或卡方检验的方法来进行验证。 列联表是两个分类变量的分类水平之间形成的交叉频数表,通过计算行百分比或列百分比,对实际频率和期望频率进行对比分析,例如一个经典的列联表如下: 对比表
阅读全文
摘要:【数据分析师 Level 1 】16.回归分析 1.基本概念 线性回归的出现 当被解释变量和解释变量都为连续型,且存在线性关系时,可以采用线性回归对被解释变量进行预测。 多元线性回归的出现是非常自然的,由于在一元线性回归中,因变量只能依赖一个自变量来解释,换一句话说,就是我们只能在一维空间中来解释世
阅读全文
摘要:【数据分析师 Level 1 】15.因子分析 基本概念 什么是因子分析? 主成分分析时一般情况下不能对主成分所代表含义进行业务上的解读,因为主成分方向上一般不会恰好某些变量权重大,而另外一些变量权重都小,这也表现在主成分权重的形成的散点图会偏离坐标轴。如果可以将主成分的坐标轴进行旋转,使一些变量的
阅读全文
摘要:【数据分析师 Level 1 】14.主成分分析 主成分分析的具体方法 主成分分析是一类常用的针对连续变量的降维方法,选取能够最大化解释数据变异的成分,将数据从高维降到低维,同时保证各个维度之间正交。 对变量的协方差矩阵或相关系数矩阵求取特征值和特征向量,经证明,对应最大特征值的特征向量,其方向正式
阅读全文